| |
首页 >> 关于我们>> 翻译资讯 |
|
|
|
神经网络翻译为什么会火? | 发布者:上海翻译公司 发布时间:2017-05-02 |
|
神经网络模型是一个很前沿的技术,那它为什么能够在机器翻译领域能起到如此大的作用呢?实际上,神经网络模型模仿了人脑的工作机制,整个模型由大量的“神经元”来构成,一个“神经元”完成一些简单的任务,然后通过对这些“神经元”的组合来协调工作,最终得到更加出色的效果。 而以前的统计翻译模型更像一个机械系统,它由很多个组件来构成,包括短语组件、分词组件、条序组件还有原模型等等。每个模块都是有各自的功能和各自的目标,然后机械地拼装在一起,完成一个翻译的结果。和它相比,神经网络翻译模型更像一个有机体,模型里面有很多参数,这些参数都是为同一个目标来调整和优化的;它们中间的结合和交互更加有机,所以整体效果会更好。 另一个不同是,两种模型的内部信息的表达方式也不一样。在统计翻译模型里,其表达方式能够识别词,但却不能够表达词与词之间的关系,比如两个词的词义是相似还是相反的。而我们的神经网络翻译模型,它使用一个十数位的向量来表达每个词,它的表达能力更丰富、更灵活,以及能够更好地来表达词和词之间的关系。比如说“计算机”和“电脑”这两个词,那么它们很可能在向量空间里离得很近。这种表达方式能够顾及到更多这样的关系,它的内部表达是一个有机整体,从而生成更通顺的翻译结果。 有道很早就开始研究机器翻译领域,之所以在神经网络翻译领域能够获得这样的效果,有几方面的原因。 首先,有道在机器翻译领域深耕了近十年,我们积累了大量的优质的语料和技术。我们依托有道词典积累的语料和用户数据,能够在英语学习这种翻译场景下做到最好。其次,我们更加关注中文和其他外语之间的翻译,所以火力更加集中,我们针对中文特有的语言现象做了非常多的优化,包括中文的分词等等。这些优化都直接体现在最终的翻译结果中。另外,我们集合网易公司的研发之力,和网易杭州研究院一起,攻克了数据处理、大规模框架、模型优化、领域适配等技术难题,开发了一些我们特有的技术,比如我们自己的领域适配技术,使得我们的模型能够自动识别不同场景。目前已经在新闻、学习、口语和一些科技领域等场景下做到了最优。” 我们做的神经网络翻译技术,目前可以很便捷让用户体验到。比如用我们的翻译引擎来做文本翻译,翻译效果比以前有了很大的提升;有道翻译官的拍照翻译,用户只需要对文本进行拍照,就可实时展现出神经网络翻译的结果。另外,我们人工翻译的团队也开始全面使用有道上线的神经网络翻译技术,推出了“有道人机翻译”服务:客户提交订单后,神经网络翻译模型会先做一版初步翻译,译员们再在这个基础上进一步调整,这就很大地提高了翻译效率,同时翻译费用降低了50%。 我们为什么要投入这么巨大的人力物力财力,研究神经网络机器翻译呢? 最直接和现实的价值就是,神经网络翻译能够帮助人打破语言的障碍,使得信息的流通更加通常。纵观历史,信息交流的变革都是对人类技术进步有很强的刺激作用,往远看有印刷术、造纸术,近代有无线和有线电报等,以及到今天互联网。虽然目前来看,信息技术的发展使得数据传输不再是瓶颈,但是另一个面临的问题就是语言的障碍,比如数据传过来没有问题,但能不能看懂和理解就是另外回事。那么神经网络翻译能够帮助人们打破这个障碍,使人的交流更加通常,这个意义是非常重大的。 同时,神经网络翻译对整个人工智能领域有明显的促进作用。语言和文字体系是人类特有的特性,所以如果我们没有真正的理解语言的机制,那么就不可能说我们真正理解和做到人工智能。而在神经网络翻译的研究过程中,既包括了对语言的理解,也包括了语言的生成,所以对它的研究能够很好地促进人工智能整体发展。
本文摘自网易有道首席科学家在2017GMIC(全球移动互联网大会)未来创新峰会上的主题演讲 |
|
|
|
|
|
|
|
|