从光芒万丈的Alexa、Siri到默默无闻的自动语音客服,遍地开花的聊天机器人已经开始呀呀学语。但是,这群“新生儿”却有一个致命的弱点:不够聪明。
如何让机器学会保持一个完整的对话始终是人工智能界最困难的问题之一。因为若想了解一句话或一段文字的真正意义,机器(甚至人)需要对世界有一定程度的理解,它们需要“常识”。
如今,为了解决这一难题,Salesforce公司的研究人员们想出了一个妙招:在教一个算法其他技能之前,先教它说第二种语言。
他们发现,当一个机器学习系统学会如何把一种语言翻译成另外一种语言时,它会自动学会单词之间的关系。而若以这个系统为基础,再训练另外一个应用时(比如对话,或察觉文字中的情绪),它的表现将远好于从零建立的系统。
Salesforce的首席科学家、机器学习专家Richard Socher对此表示:“我们所做的基本上就是把机器翻译的数据拿来,去教一个模型如何理解单词和情境。”
有很多“机器学习的创新”可以用来提高机器人的语言能力,Salesforce的研究成果只是其中之一。正如许多基于深度学习的计算机视觉系统都会提前接受网络训练,Socher认为,机器翻译对自然语言系统的作用也是类似的。
作为一个集销售、营销以及客户互动管理为一体的大型网络平台,Salesforce已经在其Einstein平台中提供一系列的人工智能工具。比如,一个可以对电邮和讯息中的情绪进行自动分类的工具,以及一个根据员工之前的工作,自动对他需要追查的线索进行优化的工具。
Socher相信,他们这个发现将会提高Einstein平台的自动语言能力,“对于聊天机器人和自动客服来说,它‘超级’有用。”
在测试中,研究人员首先需要训练一个深度学习系统在英语和德语之间进行翻译。为此,他们给一个多层神经网络提供了大量已经翻译好的文件,并慢慢调试各种参数,直至它可以自行产生不错的翻译结果。
在学会翻译之后,研究人员们就开始训练这个“双语人工智能”去学习更多的技能了,比如判断一段文字背后的情绪,对各种问题进行分类,以及回答问题。在对比测试中,经过双语训练的神经网络的成绩远好于没有经过双语训练的系统。
由于机器翻译已经是一个成熟的领域,研究人员有大量的数据来进行训练。“翻译和语言的其他部分之间有着极其重要的关联,”Salesforce的研究员Bryan McCann说道:“(翻译数据)一般涉及面非常广,它们包含着各种对自动语言处理有用的信息。”
编辑:陈翔宇
来源:https://www.technologyreview.com/s/608382/to-build-a-smarter-chatbot-first-teach-it-a-second-language/