专栏名称: 差评
这些东西,大佬们肯定不想让你知道...
目录
相关文章推荐
纯银V  ·  疯了,Mac ... ·  2 天前  
泽平宏观  ·  A股三次大牛市:启动、上涨与终结 ·  5 天前  
51好读  ›  专栏  ›  差评

科学是如何优雅地解决语言翻译问题的?

差评  · 公众号  · 热门自媒体  · 2017-03-17 23:59

正文


科技

改变生活


今天下午,世超说要去买星巴克喝,各位差友都知道,差评君在村里办公,买星巴克是要进城的。。。


结果跟他出去的同事,全翘班了一下午!


请忽略群名。。。


世超左右不分到 b 和 d 都能弄混,所以很讨厌英语,英语极差。


甚至因为他总错打单词,差评公众号的年度热词有个错词。。。


把 Android 打错成 Andriod  超多次


估计不少差友也有英语不好的困扰,毕竟不是谁都爱学语言的。


这时候翻译类软件就派上用场了,不过很多时候这些翻译软件并没有什么卵用,而是让沟通更困难。。。


 “ 松下问童子 ” 的翻译

(Matsushita 是松下电器的意思,我竟无力反驳。。。)


讲真,就这种二货程度,还是很多人研究了几十年才捣鼓出来了。。。


一开始,他们想出了一个简单粗暴的方法,把句子里的词逐个翻译成目标语言,然后再根据语法调整顺序。


比如把西班牙语翻译成英语,先拆分


再调整语序

图来自知乎@九五要当学霸


这么做,需要很多语言学家来编辑语序语法规则,全世界那么多语言那么多规则,他们多半要累死。。。


而且,有的时候,语序是个谜一样的东西,比如 “ 喂猪了么? ”,“ 猪喂了么? ”,“ 喂了猪么? ” 顺序不同,但完全特么一回事!


这就尴尬了,后来这些人想出了一个更好的方法——利用统计学。


管他语法不语法,按照概率来呗!


找出所有可能的组合


用这些组合拼凑出所有可能的句子,然后按日常生活中出现概率最高的为准,这在一般情况下结果是对的。


有了这玩意之后,自然语言处理大师 Frederick Jelinek 说了这样一句话 Every time I fire a linguist, the performance of the speech recognizer goes up ”(每次我毙了一个语言学家,我的翻译准确度就会提升不少)。。。


Frederick Jelinek


后来神经网络火起来之后,不少工程师开始用神经网络优化统计翻译算法,不过概率这种东西,有的时候也会出偏差。。。


我他妈明明是喜欢下班啊!!!


果然是神经机器翻译。。。


于是,基于机器深度学习的人工智能翻译出来了~


咳咳,具体原理么,差评君实在是不想说,因为此处数学超能预警。。。


看懂算我输!

(此为基于循环神经网络学习的基础原理的一小部分。。。)


虽然这些东西我们未必看得懂,但我们却可以轻松简单的享受这项成果~


比如世超最近用上了一个叫 “ 彩云小译 ” 软件。


按照惯例,先念个开场诗~


卧槽有点准啊!


再问点别的。。。


程序员快来撕~


这里要说一下,右下角那个自动的选项,彩云小译会自动识别你说的是中文还是英文,只要你想,随便说,无缝切换~


自动识别模式可以自由切换


而且他能翻译很多明星,对于日常的东西特别全~



更叼的是,他连一些很不正经的俚语都能翻译。。。


可以分清 “ 小鸡 ” 和 “ 小鸡鸡 ”


而且因为 AI 训练的比较好, Google 翻译 “ 松下问童子 ” 出现的蠢答案,在彩云小译上是不会出现的~


虽然翻译的没有那么文雅,但已经能完整表达意思了


如果插上耳机,你还可以体验同声传译效果,对方正在说话的时候,你在耳机里听到的直接就是翻译,延迟也就几秒,沟通无障碍~


这个跟外国人交流时候的屏幕颠倒小细节,简直不能太贴心!!!


这个小东西,对于像世超这种英语比较残废的人来说,简直就是福音,甚至你可以一句一句的跟他读,来学习英语!


下面给大家看个视频,看了里面的效果,请护好膝盖。。。





“ 我们需要这样的好产品 ”