Google 最新的机器翻译功能,可以让不同语种的人之间沟通变得更加便利。这个便利是得益于该机器翻译功能可以直接将语音翻译成文字。
普通的机器翻译对语音的翻译,首先是将语音转化成文字,然后将文字翻译成目标语言。但是,在语音识别中的任何一点错误,都会导致语音转录成文字的错误,从而导致最终翻译结果的错误。
在深度学习领域的科技巨头—— Google Brain 工作的研究人员,已经开始转向利用神经网络来减少翻译过程中的这些中间步骤。在翻译的过程中,如果采取跳过转录过程的方法,可能会提升翻译的准确率和加快翻译的速度。
Google的这个团队,利用数百小时的西班牙语的音频,和其对应的英文文本作为训练集,来训练该翻译系统。在不同情况下,训练神经网络的多个不同层级(这些神经网络是计算机系统模仿人脑创造的),从而匹配西班牙语语音和其对应的英文翻译文本的部分。为了做到这一点,这个训练对西班牙语语音的波形进行分析,以了解哪些语音部分与哪些书面英语部分相对。
当这个系统执行翻译任务时,每层神经网络利用这些之前学习到的知识(哪个部分的西班牙语音与哪个部分的英语书面文本相对应)来操纵语音波形,直到它变成相应的书面英语的部分。
对应模式
来自于加拿大Montreal大学的Dzmitry Bahdanau说:“这种训练就是在寻找源语言语音的波形和书面文本之间的对应关系模型。”Dzmitry本人并未参与这项研究。
在一段时间的学习之后,相对于之前要先将西班牙语语音翻译成西班牙语文字的方法而言,Google的新系统能够以更高质量将西班牙语语音翻译成英文。这个比较的结果是根据BLEU评分而得出的。BLEU是一种根据比较机器翻译结果和专业翻译人员翻译结果而进行评分的一种机制。
来自英国爱丁堡大学的Sharon Goldwater 说:“这个系统,尤其是对翻译那些说的人很少的语言非常的有用。”
例如,国际救援队可以利用它快速地组建一个翻译系统,来与他们想要协助的人进行沟通。Goldwater说,比如2010的海地地震,当时就没有可以翻译海地克里奥尔语的翻译软件。
Goldwater的团队正在使用一个类似的方法来翻译Arapaho, Arpaho 是一种仅被1000左右人口所使用的语言,使用这种语言的人都来自美洲的印第安人土著部落。Goldwater团队也在用相同的方法,对阿伊努语(Ainu)进行翻译,Ainu是一种仅被少数日本部落所讲的语言。
稀有语言
由于这个系统不需要书面版本的源语言来实现翻译,所以其也可以被用于翻译那种很少用文字所记录的语言。
Goldwater说,直到这个系统经过更大的数据集合测试之前,很难将新系统与传统翻译系统进行比较。但是她也认为,这个新的系统可以被设定为评价未来新的机器翻译系统的标准。
现在市面上已经有一些可以让讲不同语言的人进行实时对话的的翻译系统。Skype在2014年推出了一个实时的语音对文本的翻印功能,它现在可以支持9种语言了,包括普通话,阿拉伯语以及一些常见的欧洲语言。但是Skpye 采用的方法,与现下其他的翻译方法相似,都是先将语言翻译成该语言的文本,之后在翻译成目标语言文本。
Google的翻译功能已经在一些最广泛使用的语言上使用了神经网络,神经网络的运用可以使翻译器一下子识别整个句子,来找出最好的翻译结果。
有趣的是,这个系统似乎在使用“interlingua”来进行从一种语言到另外一种语言的翻译。“interlingua”是指在不同的语言中,表达相同意思的通用句式,这意味着,这个系统可以在没有明确的被训练的基础上进行翻译。GoogleBrain的研究人员也建议,这种新的语音到文字的翻译方法也可以运用到多种语言翻译的系统上。
不过由于机器翻译一直在不断革新,所以很难说神经网络要如何应对这些革新。Bahdanau说:“我们很难理解里面到底发生了什么。” 大部分的神经网络学习,我们都无法理解模型最终时如何被学习到的,就是里面具体执行的算法是如何运转的。
编辑:邓雪莹
MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。
分享至朋友圈才是义举
一个魔性的科幻号,据说他们都关注了