科技

“翻译神器”彩云小译速度近乎真人同传

字号+ 作者:虎子 来源:未知 2018-10-18 09:53 我要评论( )

现如今, 翻译 软件已经不是个新鲜事儿了,从早期的谷歌翻译到后来的有道、搜狗、百度、讯飞、猎豹等,各个大厂都在布局智能翻译产品。尽管翻译工具层出不穷,操作繁琐、准确性低、译文别扭却是通

       现如今,翻译软件已经不是个新鲜事儿了,从早期的谷歌翻译到后来的有道、搜狗、百度、讯飞、猎豹等,各个大厂都在布局智能翻译产品。尽管翻译工具层出不穷,操作繁琐、准确性低、译文别扭却是通病。此外,多数翻译软件还只能处理简单语句,对于复杂交流、专有名词、诗词歌赋却时常束手无策。

        最近,一款被众多微博网友称为“翻译神器”的产品走入36氪视野。这款名为「彩云小译」的翻译应用上线于2017年初,曾登顶App Store热搜、微博热搜,更多次受到App Store推荐。

        彩云小译可实现同声传译和交互翻译两块功能,支持中英日三种语言。该产品操作十分简单:无需手动控制,用户只要语音输入,彩云小译就可进行实时英汉互译,速度接近于真人同传。译文质量方面,我特别测试了复杂句和《论语》名句,小译的翻译准确度、行文流畅度表现不错,高于市面很多产品。

        是什么能够让彩云小译的翻译如此准确高效呢?

        彩云科技创始人袁行远提到:之前的翻译软件大多使用统计机器翻译技术,简单理解就是碰到中文就去查字典,然后把这些查来的英文单词拼在一起,没有经过任何语义上的处理,因而准确性低、译文也不通顺。

        基于这一问题,彩云小译在语义解析上下了功夫,基于人工智能神经网络,机器会判断句子中哪个部分需要查字典,哪个部分可以直接套用神经机器翻译模型,从而展示出计算机认为的最佳译文。

        为提升翻译质量,彩云小译在数据预处理上使用了海量数据库,包括维基百科、古文诗词等翻译语料库、国内中英翻译最高的资源聚集地之一的译言网等。这样就能保证译文可精准命中词条,这也解释了为什么彩云小译能准确地翻译古诗词的原因。 

         彩云小译并不仅仅停留在移动同传,袁行远为36氪展示了彩云小译的新功能:网页翻译、视频翻译和文档翻译。在浏览网页时,点击书签栏或插件中的彩云小译,网页就可自动转化为中英对照模式;浏览YouTube视频时,视频也可实时出现彩云小译同传的中/英字幕;如果将pdf文档导入,彩云小译则可将文档变为中英对照,50页论文在1分钟以内就能翻译完成。

 

网页翻译

 

        据悉,彩云小译已有超过200万注册用户,新功能上线不到一个月,已有百万余篇网页、十万余文档得到翻译。为提升译文质量,彩云小译上的译文均开放给用户编辑修改,目前已积累了数百万字的用户校对,这些语料也将成为小译深度学习的训练数据,用以更好的完善神经机器翻译模型。

       商业落地层面,目前市场上绝大多数语音同传技术在准确度、延迟性上尚未达到能够完全取代人工同传的程度。然而,将机器翻译技术与传统翻译行业结合,如在医疗、政府公文翻译等领域,则能提升产业效率,节约人力成本。

       搜狗CEO王小川曾提出:“机器翻译类似于‘语音识别’,独立存在的商业模式有限,最好的方式是将这个技术融入到其他产品中去做升级,从而让其他产品更强大。”彩云小译也在将自己的自然语言处理与机器翻译技术与其他现有产品结合,目前已提供了公开API给维基百科、石墨文档、财新传媒等第三方客户使用,具体的商业变现模式公司目前不便透露。

       其实,彩云小译并不是彩云科技旗下唯一一款AI产品,该公司曾经还上线过一款精准天气预报应用「彩云天气」,36氪也曾于2014年报道过这款产品。彩云天气可覆盖全球任何地点天气情况,并提供精确到街道级、分钟级的天气信息。今年雨季,彩云天气再次登顶了App Store付费应用榜榜首。

边说边译,彩云科技想用AI让人人拥有贴身同传

       从天气预报到随身翻译,看似割裂的领域却都是基于同一内核:人工智能。基于从气象机构等收集的气象雷达数据,如区域云分布情况、云层厚度、内部水分含量等,彩云天气的人工智能天气模型会对这些二维图像进行分析,从而判断云测走向和降雨区域及概率,经由神经网络分析、判断、处理后转化为用户可见的天气预报结果。

       现如今,彩云天气的数据已经渗透到各个产品、应用:饿了么根据天气提供用户需要等待时间的功能就是基于彩云天气的数据达成;滴滴打车也参考彩云天气数据进行行程估价;高德、今日头条的天气信息,小米、金立、酷派等手机的原装天气应用也都引用了彩云天气数据。除此之外,彩云天气数据也被应用于航海、水电、航天领域,许多相关重点企业都在调用天气数据以指挥作业。

       据悉,2014年4月上线至今,彩云天气已有千万级直接用户,通过其他app进行数据调用的用户量达到亿级,数据的每日调用量达到数亿次。当前团队以向企业提供天气数据为主,按调用次数收费。

       据悉,当前彩云科技团队有33人。未来,在继续完善天气模型、翻译模型之外,团队也将继续探索AI技术的应用可能性。袁行远告诉36氪:翻译方面,彩云小译将继续研发视频实时字幕翻译功能,并在应用端融入更加丰富的信息形式。同时,彩云科技也继续从事神经网络技术方面的基础科研,希望将AI技术为更多人所用。

转载请注明出处。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章