专栏名称: 两个质子
我们是谁?我们从哪里来?我们到哪里去?一群为科学着迷的普通人,一群为生活着迷的科学家。我们就是两个质子。
51好读  ›  专栏  ›  两个质子

向世界开源聊天机器人的评估训练模型,Facebook的野心在哪里?

两个质子  · 公众号  · 科学  · 2017-06-23 17:59

正文

2016 年是聊天机器人接管硅谷的一年,不过只有一个问题:这些聊天机器人不知道怎么聊天。


图 | 虽然2016年各种聊天机器人纷纷涌现,但它们其实不怎么会聊天


Facebook和很多硅谷的公司都在炫耀可以对话的软件——比如可以预定航班和管理银行账户的手机应用程序。然而,对话技术仍然落后。


最近几年,Facebook,谷歌和微软等公司使用了深度神经网络,已经能可靠地识别图片中的人脸和物体,也能识别智能手机上的语音指令,还可以在不同语言间完成翻译工作。


但是,打造一个真正的对话机器人仍然让人摸不着头脑。这需要大量不同的人工智能技术,研究人员仍然在试图找到整合这些技术的方法,或者,他们得先确定这些技术是不是真有效。


考虑到这些困难,Facebook 研究人员团队建立了一个新的框架,让多个聊天机器人变得更健谈——这可以为人工智能技术提供多种对话技术的训练场。


Facebook的研究人员Jason Weston说:“您需要了解机器学习方法可以解决哪些问题,解决不了哪些问题,这样我们才能知道如何改进它。我不认为只训练一个任务就可以让我们做出一台智能机器。”


Facebook给对话机器人准备的训练场叫 ParlAI,这个研究对话的平台很适合 Facebook 的中央智能实验室,在那里有不少说法语的研究人员。为了可以利用无数新出现的技术,Facebook 正在与世界各地共享 ParlAI 这个开源工具。


除了 ParlAI 软件外,Facebook 还提供了多种公开的数据集,让研究人员可以训练自己的智能体(agent)。该系统还与亚马逊的 Mechanical Turk 服务(在线零售商的众包劳动力平台)相关联,让研究人员可以测试对话机器人,让它们与真人交谈。反过来,这些测试将产生更多的数据,创造出对话机器人开发的良性循环。


开放平台


Facebook 的最新举措只是大量加快对话人工智能技术进步的努力之一。所有的大型互联网用户——从谷歌到亚马逊,微软和IBM,都在向着这个方向发展。所有人都希望从根本上改变人们与机器交互的方式


今年 1 月,微软收购了加拿大创业公司Maluuba。这家公司专门从事对话性人工智能技术的研究。 亚马逊正在努力建立自己的数据集,用于训练对话机器人,这将是Alexa平台成功的关键。 近两年来,Facebook一直在使用名为Facebook M的实验数字助理收集一些特别复杂的数据。


为了做出可以真正和人交谈的机器人,每个公司都采取了略微不同的方向。Facebook关注可以从现有对话和其他数据集中学习的神经网络,而Maluuba专长于强化学习技术,机器人通过极端的尝试和错误学习。


但这些方法并不是相互竞争的关系。最终的成功将来自不同技术的组合。负责监督IBM内部一个自然语言研究实验室的Yunyao Li表示:“我们不会使用只有一种机器学习方法的系统来解决所有问题。“相反,我们在正确的时刻使用正确的机器学习方法。”


这种混合方法是推动ParlAI创建的思想训练场可以推进神经网络研究,强化学习以及任何可能有用的东西。它旨在推动新技术的发展,这些技术不仅属于一家公司,而是来自整个AI研究人员的世界。最终目标是将各种方法结合到可以真正聊天的聊天机器人。


巴黎出生的研究者Yann LeCun负责Facebook的AI实验室。他表示,通过让ParlAI开源,Facebook再次释放出信号,希望可以帮助所有人向相同的目标前进,而不是独自完成目标。