我 相 信 这 么 优秀 的 你
已 经 置 顶 了 我
翻译|徐天宇 选文|小象
转载请联系后台
正如在最近的谷歌DeepMind会议上看到的那样机器学习和AI在最近几年渗透到了大量的工业领域。
很多东西以前只是作为理论上的应用在讨论,现在我们看到机器学习被应用到智能车,电子游戏,数字营销,虚拟个人助理,聊天机器人,以及生活的其它方面。
AI正在摧毁和提高很多行业,但是目前来看还要克服很多障碍才能够使得人类失业。在最近的翻译比赛中,人类击败了AI,但是AI成为数字巴别鱼(科幻小说中的翻译器)只是时间问题。
◇◆◇◆◇
Game over
我们有必要回顾一下机器学习和AI是怎么超过人类的。1996年IBM的计算机深蓝第一次挑战世界顶尖象棋选手Garry Kasparov。尽管第一次Kasparov赢了,但是1997年再一次比赛,深蓝赢得了胜利。从那以后计算机不断进步,当然在象棋方面就是完胜人类。
然后是围棋,一个古老的中国棋类游戏,它看起来对于最先进的计算机来说,想要获得胜利,都太复杂了。据说,它的变化比可见宇宙的原子数目还多。因此,当2016年3月谷歌DeepMind的AI程序AlphaGo以4-1击败李世石的时候,让世人感到震惊。
这个月的围棋峰会,AlphaGo迎战世界第一柯洁,他最早说过,他不会输给冷血的机器。但是后来他承认“AI的进步远远的超过了人类的想象”。在这次的活动中,机器不仅挑战人类,还有机器和人类一起配合下棋的环节,也从侧面说明机器可以打败人类也能帮助人类。
◇◆◇◆◇
你说过什么?
现在工业的关注点是翻译。长期以来,语言生成和语言翻译对于任何机器而言都是最难的挑战之一。上世纪50年代,IBM已经在研究机器翻译了,但是直到90年代,Altavista’s Babel fish的开发,公众才有机会接触这类工具。然而,机器翻译有它的局限性:它通过字典逐一的翻译,提供直白的翻译,但是不考虑语义、语法和词法的问题。
统计机器翻译(SMT)成为了翻译技术研究的新阶段。SMT通过模型比较单词或者短语之前的翻译结果(如果可以当然是专业的翻译),然后选择最常用的措辞。机器学习和AI是掌握语言复杂性的下一步,在这个领域,标准的翻译技术已经失败了。机器和人一样,机器需要学习在什么样的上下文下使用不同的短语和句子,然后随着时间不断进步产生易于理解的、相关的语言材料。神经机器翻译(NMT)是谷歌追求更精确的翻译提出的方案。NMT技术专注于整个句子而不是句子的孤立的成分(词、短语)。方法是将这些句子的成分组合成最自然的使用方式。当AI技术应用到这个过程中,NMT可以通过分析其它完整翻译的结构和它们随着时间的变化来学习到其中的细微差异。
◇◆◇◆◇
还没到时候
我们已经看到科技的进步是多么的快速,难怪很多学语言以翻译为生的人会忌惮NMT。但是相对的,在世界各地,有人有商业会为语言屏障的倒下而感到兴奋,然后AI成为我们新的语言。所以二月份当人类译者和谷歌的新NMT(和Naver Papago的组合)在首尔的首尔大学比赛(韩国国际口译和翻译协会合作)的时候,空气中混杂着不安和兴奋。对于译员来说,这绝对是对于它们饭碗的考验。比赛要求双方在50分钟内翻译两部分的文本,一部分是文学类的,另一部分是非文学类的。人类以明显的优势在每一种文本以及两种语言翻译方向(韩文到英文,英文到韩文)上打败了两个基于AI的翻译工具。很多人说,翻译不像数学或者象棋和围棋这样的游戏,没有一个明显的胜者,因为评价翻译结果的是人类他们可能不客观。然而,考虑到是独立的评判结果,并且评判专注于明显客观的任何以此为母语的人都能发现的语言学错误,我认为评判是客观和有价值的。有评论者认为NMT 翻译得到的文本,90%在语法上很糟糕或者虽然没有明显的错误,但是任何受过教育的以目标语为母语的人绝对不会这么翻译。在这次人机大战中人类的巨大胜利让很多语言工作者都松了一口气。不可避免的是,随着NMT的进步,有严格内容和术语限制的科技文本可能就可以由机器完美的翻译而不需要人类事后的修正。
然而文学和商业翻译,更多的需要根据目标市场的需求生成翻译结果,对于最好的AI机器翻译来说还是一个难点。翻译这类文本基于研究和上下文,需要创造性思维和与目标受众的共鸣。在翻译和语言学方面,机器人还有很长的路要走。
徐天宇
上海船研所通信与信息系统研究生在读,正在学习嵌入式。主要兴趣:数据分析,体育运动。