四月末的京城迎来了移动互联网年度盛会。
以“天工开悟”为主题的2017 GMIC(全球移动互联网大会),人工智能毫无争议地成为了最火热的议题。在4月27日的领袖峰会中,来自英国的著名物理学家斯蒂芬·霍金教授也通过视频的方式发表了演讲,谈及了其关于人工智能的看法。他认为人工智能是一把双刃剑,在推动人类社会快速发展的同时,也可能会给人类文明带来颠覆性的伤害。
霍金对人工智能产生的担忧,来自于“人工智能系统失控的潜在风险,随着不遵循人类意愿行事的超级智能的崛起,那个强大的系统威胁到人类。”
他进一步阐释道,在遵循了“计算机在理论上可以模仿人类智能,然后超越”这一原则,我们无法确定人类将无限地得到人工智能的帮助,还是被其藐视并被边缘化,或者很可能被它毁灭。而就目前来看,聪明的机器已经开始代替人类正在从事的一些工作,未来可能迅速地消灭数以百万计的工作岗位。
而就在前段时间刚刚热映的电影《攻壳机动队》也在影片中阐释了这一科学问题。这部电影改编自被奉为日本动画神作的《攻壳机动队》,作者士郎正宗在影片中讨论了一个关于人工智能的终极问题:当人工智能发展到极高的水平,甚至开始超越人类时,人和人工智能的边界在哪里?人工智能会反过来侵蚀人类吗?还是人与人工智能合为一体,最终以另外一种形式被“消灭”?
或许影片中的问题正是霍金以及大部分科学家的担忧所在。也正因为如此,霍金呼吁科学界和政府机构对人工智能的崛起加以有效的控制,他说到“欧洲议会正在呼吁起草一系列法规,以管理机器人和人工智能的创新”“我们需要确保机器人无论现在还是将来,都为人类而服务”。
对人工智能的控制和警惕不无道理,不过就目前来看,人工智能给人类带来的更多的是便利。
回到今年的GMIC展台,不少企业都带来了其最新的人工智能技术,这些技术未来将极大地改变人们的生活。其中最引人瞩目和有强大实际作用的,就是有道刚上线的“神经网络翻译”技术。
所谓人工智能,很大程度上都是通过深度学习来实现的,也就是说深度学习是推动当前人工智能热潮最关键的技术,而神经网络翻译就是深度学习在机器翻译领域的具体应用。
可以说,神经网络翻译是目前机器翻译领域最前沿的技术。原因在于,与之前的我们用了十几年统计翻译模型相比,它进步了不止一点点。
比如某翻译软件的翻译结果,让人不得不怀疑是否用的就是统计翻译模型:
然后这是有道神经网络翻译模型的结果:
可以很明显的看出来,统计翻译(SMT)的翻译结果:不通顺、蹩脚,重点是不像“人话”,更像是机器拼接出来的结果。而有道的神经网络翻译的结果呢?通顺、巧妙、干练,简直就像一个标准政客该说出来的话。
这就是神经网络翻译的神奇所在。
但是,为什么会好这么多?
神经网络翻译(NMT)采用的是神经网络结构,它对翻译的全过程整体建模;与统计翻译模型(SMT)相比,神经网络翻译模型更像一个有机体。模型里面有很多参数,这些参数都是为同一个目标来调整和优化的;它们中间的结合和交互更加有机,所以整体效果会更好。
另外,二者的内部信息的表达方式也不一样。统计翻译模型的其表达方式能够识别词,但却不能够表达词与词之间的关系,比如两个词的词义是相似还是相反的。而神经网络翻译模型,它使用向量来表达每个词,表达能力更丰富、更灵活,以及能够更好地来表达词和词之间的关系。比如说“计算机”和“电脑”这两个词,那么它们很可能在向量空间里离得很近。
除了纵向和过去对比,横向对比来看,神经网络翻译各家都做,有道有什么不同?再看个例子,首先这是谷歌翻译的结果(谷歌去年上线了神经网络翻译)
然后再看一下有道翻译的结果:
可以看到,有道上线的神经网络翻译的结果,十分通顺和准确,几乎没有任何语法错误。这个结果,即使是普通人中等英文水平,都很难达到。再来看谷歌翻译的结果,可以看出有明显的不合适的地方,比如“起起伏伏”以及一些词之间的关系搞错。
所以从某种程度上,至少从中文翻译这件事上,有道已经后来居上了。
不过无论哪家的神经网络翻译技术,最终而言,对用户来说都是利好。
你可以想象你在异国他乡,完全不懂英语的情况下,如果度过漫长而艰难的一天么?而神经网络翻译,或许就能打破这种语言带来的障碍,人们解决语言问题的成本和门槛将变得极其低,或许简单一拍,你想知道的内容,就可能尽收眼底。
有道神经网络翻译在有道翻译官中的应用