向世界开源聊天机器人的评估训练模型，Facebook的野心在哪里？

两个质子 · 公众号 · 科学 · 2017-06-23 17:59

正文

2016 年是聊天机器人接管硅谷的一年，不过只有一个问题：这些聊天机器人不知道怎么聊天。

图 | 虽然2016年各种聊天机器人纷纷涌现，但它们其实不怎么会聊天

Facebook和很多硅谷的公司都在炫耀可以对话的软件——比如可以预定航班和管理银行账户的手机应用程序。然而，对话技术仍然落后。

最近几年，Facebook，谷歌和微软等公司使用了深度神经网络，已经能可靠地识别图片中的人脸和物体，也能识别智能手机上的语音指令，还可以在不同语言间完成翻译工作。

但是，打造一个真正的对话机器人仍然让人摸不着头脑。这需要大量不同的人工智能技术，研究人员仍然在试图找到整合这些技术的方法，或者，他们得先确定这些技术是不是真有效。

考虑到这些困难，Facebook 研究人员团队建立了一个新的框架，让多个聊天机器人变得更健谈——这可以为人工智能技术提供多种对话技术的训练场。

Facebook的研究人员Jason Weston说：“您需要了解机器学习方法可以解决哪些问题，解决不了哪些问题，这样我们才能知道如何改进它。我不认为只训练一个任务就可以让我们做出一台智能机器。”

Facebook给对话机器人准备的训练场叫 ParlAI，这个研究对话的平台很适合 Facebook 的中央智能实验室，在那里有不少说法语的研究人员。为了可以利用无数新出现的技术，Facebook 正在与世界各地共享 ParlAI 这个开源工具。

除了 ParlAI 软件外，Facebook 还提供了多种公开的数据集，让研究人员可以训练自己的智能体（agent）。该系统还与亚马逊的 Mechanical Turk 服务（在线零售商的众包劳动力平台）相关联，让研究人员可以测试对话机器人，让它们与真人交谈。反过来，这些测试将产生更多的数据，创造出对话机器人开发的良性循环。

开放平台

Facebook 的最新举措只是大量加快对话人工智能技术进步的努力之一。所有的大型互联网用户——从谷歌到亚马逊，微软和IBM，都在向着这个方向发展。所有人都希望从根本上改变人们与机器交互的方式。

今年 1 月，微软收购了加拿大创业公司Maluuba。这家公司专门从事对话性人工智能技术的研究。亚马逊正在努力建立自己的数据集，用于训练对话机器人，这将是Alexa平台成功的关键。近两年来，Facebook一直在使用名为Facebook M的实验数字助理收集一些特别复杂的数据。

为了做出可以真正和人交谈的机器人，每个公司都采取了略微不同的方向。Facebook关注可以从现有对话和其他数据集中学习的神经网络，而Maluuba专长于强化学习技术，机器人通过极端的尝试和错误学习。

但这些方法并不是相互竞争的关系。最终的成功将来自不同技术的组合。负责监督IBM内部一个自然语言研究实验室的Yunyao Li表示：“我们不会使用只有一种机器学习方法的系统来解决所有问题。“相反，我们在正确的时刻使用正确的机器学习方法。”

这种混合方法是推动ParlAI创建的思想。训练场可以推进神经网络研究，强化学习以及任何可能有用的东西。它旨在推动新技术的发展，这些技术不仅属于一家公司，而是来自整个AI研究人员的世界。最终目标是将各种方法结合到可以真正聊天的聊天机器人。

巴黎出生的研究者Yann LeCun负责Facebook的AI实验室。他表示，通过让ParlAI开源，Facebook再次释放出信号，希望可以帮助所有人向相同的目标前进，而不是独自完成目标。