在谷歌上搜索”世界上最快的鸟是什么”,它会告诉你:“游隼。根据YouTube上的视频,游隼的飞行时速最快可达389公里每小时。”
这就是正确答案,但是这个结果并非基于谷歌什么酷炫的数据库。当你输入一个问题的时候,谷歌搜索引擎会在某个YouTube的视频里精准地截取你所需要的信息,例如从视频“世界上最快的五种鸟类”里抽取出最快的鸟儿的信息,而且还会自动屏蔽另外四种鸟。
借助深度神经网络(deep neural network)的技术,谷歌成功地做到了这点。这项突破不仅将重塑谷歌搜索引擎的面貌,也直接影响到整个公司的未来技术发展,同时还给其他互联网巨头,像Facebook和微软这些公司施加了不小的压力。
深度神经网络是一种模式识别系统,它可以通过分析庞大的数据,而学会如何完成特定的指令。上面的例子说明它已经掌握了如何从网路上截取相关网页内的长句或段落,用来回答你的问题,而且可以准确地找到问题的重点。
也就是说“句子压缩算法”(Sentence compression algorithms)正是该项技术的核心。这种语义解释对于人类来说很简单,然而机器学习起来一直很困难。深度学习目前正在语言自然理解方面高速发展,也就是如何理解以及回应人类语言的能力。
谷歌研究院产品经理戴夫·奥尔(David Orr)说:“执行这种任务必须使用神经网络算法,或者这么说吧,这是目前为止我们所知的唯一方法。我们当然必须要动用手上已有的所有最先进的技术了。”
更别说你还得需要一堆聪明的脑袋,这些聪明的脑袋还都拥有博士学位。谷歌就拥有这么一支强大的语言学博士团队,名叫皮格玛利翁(Pygmalion)。他们正在手把手地训练谷歌如何使用神经网络算法。
首先得让机器通过一遍又一遍地重复观察人类如何从一篇长文抽取相关信息。这艰辛的学习过程说明了深度学习的力量与其局限性。要训练这种人工智能系统,那你得先由人类亲自来不辞劳苦地筛选巨大的数据库。这种数据库可不简单,也不便宜。而且,现在就说机器可以自主学习了,那话可说得太早了。
“黄金数据”与“白银数据”
为了训练谷歌人工智能的问答能力,该团队让机器阅读了大量的旧新闻,通过新闻标题可以学会如何总结归纳一篇长文章。就目前来说,谷歌极度依赖着这个语言学家专家组。他们不仅可以示范压缩语句,同时也给语言成分分为不同词类,来帮助神经网络学习人类语言的奥秘。全球大约有100名这样的语言学家正在共同创造这些被称为“黄金数据”的库存,那些旧的新闻报道则是“白银数据”,它们的用途当然也很大,因为它们量大。但是黄金数据才是最精髓的。
皮格玛利翁团队负责人林奈·哈(Linne Ha)透露,近几年这个团队将会需要越来越多的语言学家。
这种需要人工辅助的人工智能系统被称为“监督学习”(Supervised learning),当下的神经网络都是这么运作的。有时候公司也可以将这项业务众包出去,更多时候它其实已经自发地在进行中了。例如,互联网上就有无数人将有猫咪的照片添加了“喵咪”的标签,这便使得神经网络学习识别喵咪变得异常简单。但更多情况下,研究人员们不得不自己亲自手动添加标签。
深度学习初创公司Skymind的创始人Chris Nicholson指出,长远看来,这种人工手动添加标签的方法是不可行的。“未来肯定不会是这样的,这得是多么无聊的一项工作呀!我简直想象不出来比这个更无趣的工作了。”
更大的问题还在于,如果谷歌手上的语言学家不包含世界上的所有语言的话,那这个系统在其他语言环境下就无法运转。目前谷歌团队涵盖了差不多20到30种语言,也就是说只能指望将来可以开发出来更加自动化的人工智能,例如“无监督学习”(unsupervised learning)。
如此一来,机器就可以自主学习,而不再需要人工手动给数据做标签了。“无监督学习”可以通过互联网或者其他渠道的海量信息自行分析与学习。Google, Facebook还有Elon Musk创办的OpenAI 这些巨头公司都正在展开这个领域的研究,但离它成为现实仍有大段距离,目前,人工智能还是需要一个像皮格玛利翁这样的语言学家团队。
编辑:王安妮
参考:连线
麻省理工科技评论首部中文图书
《科技之巅》现已上市
正在改变世界的科技事实,最值得投资人期待的技术
招聘
编辑、视觉设计、实习生(编译)
地点:北京
联系:[email protected]
MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。
分享至朋友圈才是义举