以爆猛料著称的付费科技媒体 The Information 最近又出手了,据他们报道,Facebook 的即时聊天工具 Messenger 平台上的聊天机器人根本无法理解用户的意思,情况有多惨呢?如果没有人工介入,聊天机器人的准确率只有 30%。受此挫折,Facebook 决定缩减聊天机器人的应用场景,让其只解决 “有限领域的问题”。
在今天,这个新闻并没有引起什么讨论,但仅仅 1 年前,聊天机器人,这个被简称为 bot 的东西可是几个顶级科技公司力主推荐的 Buzzword(热词)。它借用人工智能技术,将用户在对话中输入的文字、语音以自然语言理解技术进行语义分析(语音要先进行语音识别),然后由对话管理模块输出合适的回答。对话系统通常基于上百亿级别的真实人类对话,以此让 bot 用接近自然对话的方式,解决用户的诸如订餐、查询天气、闲聊等需求。
(微软的 Cortana 平台上用来点披萨的 bot)
微软基于小娜(Cortana),在 Skype 上建立了 bot 开放平台,开放了自己的自然语言处理技术,开发者可以把自己开发的聊天机器人放在 Skype 上,也能以 API 形式将它集成到其他聊天软件里;Facebook 也是类似的做法,它以 Messenger 为平台,在 Facebook 年度最重要的开发者大会 F8 上,bot 甚至被看做将会替代 app 在人们手机上的地位。另外,企业协作软件 Slack、聊天软件 Kik,也把 bot 最为自己产品的一大特色。
Messenger 的 bot 平台开放后,很快就有了上万个聊天机器人,包括天气、新闻、外卖、订酒店等各种机器人。但其实在这些 bot 刚上线时,就被很多用户吐槽:这根本就不能叫 “人工智能聊天机器人吧?”
一些聊天机器人只会处理非常简单的信息,当你跟它闲聊时,它就马上变回了高冷呆板的 “机器人”:
(“外面正在下雨吗?”,“对,正在下雨”;“哪个 WWE 摔角手更厉害?”,“外面正在下雨”;“汪汪”。“你什么意思?”)
在需要联系上下文的语境中,聊天机器人更是完全束手无措:
(“我要穿个夹克吗?”,“对,外面很冷”;“太阳镜呢?”。“我正给手机充电,你说什么?”)
正是这些情况导致用户对聊天机器人大失所望,也让一些开发者对 bot 开始警惕,30% 的准确识别率并不代表 30% 的工作可以被自动化代替,而是无休止的用户抱怨和品牌形象受损。
为什么会出现这样的情况?雷锋网就此事采访了三角兽的 CTO 亓超,三角兽的核心技术方向正是基于自然语言理解的人工智能交互系统,锤子手机的 “大爆炸”(Big Bang)功能的核心算法、Rokid 机器人聊天系统都出自三角兽。亓超本人也是 AI 领域开放域聊天和聊天机器人的顶尖专家,曾历任微软小冰开放域聊天技术创始人及百度度秘聊天技术负责人等职位。
在亓超看来,“智能” 这两个字体现在用户说什么,聊天机器人系统都能理解,而不应限制用户说的领域。按照三角兽的产品统计来看,大部分的 “query”(查询)也都属于非垂直领域内的对话,所以,开放领域聊天能力是每个 bot 必备的能力。
何谓 “开放域聊天” 能力?亓超曾在雷锋网的硬创公开课介绍过这个名词,“开放是指对用户不限定领域, 不会出现像 Siri 发布之初只能回复特定问题, 超出范围的返回搜索引擎结果, 另一方面聊天以一种模拟人类日常对话的方式进行自然的人机对话, 不同于一个冷冰冰的工具。”
在 Facebook 推出 bot 聊天平台后,有人把它和微信公众号做了对比,因为后者同样可以通过对话的形式(如输入关键词),实现特定目的。三角兽的数据揭示了两者的显著不同,在面对一个使用了人工智能技术的 bot 时,大家本能的使用习惯是以开放性的自然语言来完成任务,但在公众号中,用户会乖乖按照运营方设定好的规则来达到自己的目的。
“我们认为 Facebook 里集成的绝大多数 bot 并不具备开放领域聊天的能力,由此很多用户的问题不能很好的进行满足。” 亓超总结了大家对 Facebook 的聊天机器人不满的原因。
在亓超看来,作为一个 bot 平台,需要为第三方开发者提供完善的实现对话系统的基础能力,例如:基础的语义理解,对话管理等模块。这就好比 Windows 系统必须要提供基础的 API,才能使得开发者开发出视频播放,浏览器等 Windows 应用。
不过,亓超同时介绍,Facebook 背后的 AI 能力是非常强大的,其 AI 领军人物 Yann LeCun 是深度学习和 AI 方向的绝对权威之一;FB 的开源的深度学习框架 Torch 应用的也很广泛,DeepMind 的团队也曾是这个系统核心贡献者之一。
虽然现在 bot 在完成任务时甚至还比不上微信公众号,但这更可能是 Facebook 的 AI 技术对开发者的的开放和支持程度还需要一段时间的迭代。Facebook 决定为聊天机器人限定使用场景,是个无奈的过渡手段。
现在,微软、Slack 和 Kik 都没有披露过各自平台上的聊天机器人的情况,但从 Facebook 的情况推测,它们的正确回应率很可能也不容乐观,下一步,它们会不会也调整自己的策略,让我们拭目以待。