从语音助手到服务机器人,再到“阿尔法狗”横扫围棋界,人工智能的“能力”愈发强大,涉及的范围也越来越广。比较贴近我们日常生活的莫过于语音机器人,如亚马逊的Echo、谷歌的Home,以及如Siri这样的语音助手。在这种大潮中,Facebook也有心加入。不过,Facebook不想做语音助手了,而是通过训练机器人与人类的谈判能力打入这一市场。
谈判,是人类在日常生活中每天都要重复的行为,实际上,生活本身就充满了谈判。比如说服孩子不吃垃圾食品、买菜砍价、看电视的时候进行讨论等等。这些看似简单平常的场景实际上需要具备复杂的交流和推理技巧,由于拥有超级厉害的大脑,所以人类不以为难,但对计算机而言,谈判可以说是相当复杂而艰巨的任务了。
笔者第一次看到人类与机器人交流的假想,是在郭达与蔡明1996年的春晚小品《机器人趣话》中,相信许多人都对蔡明扮演的那个说话嗲声嗲气的机器人有深刻的印象。但直到今天,与人类进行有意义的对话对于机器人而言仍是一项巨大的挑战。因为这需要研究人员将知识与理解能力相结合,生成新型句子才可能达成目标。
目前,FAIR的研究人员已开源了该模型代码,并介绍了这类机器人所具有的谈判能力。
FAIR以“讨价还价”这一模式作为切入点,训练机器人如何分配物品,比如几本书、几顶帽子或几个球等。每场谈判的对话次数限定在10次之内,若在这一范围内双方未达成共识,则谁也不能得到物品。
实际上,这里涉及到“多问题交涉”。
在这种训练中,每个智能体都被赋予了专属的价值函数,代表的是对每种物品类别的在意程度。比如,对机器人而言,对每个球的在意程度是3。就像人类的生活场景一样,我们不知道别人的想法,同样,机器人也不知道其他机器人的价值函数,只能通过谈判中的对话进行推断。
FAIR团队在训练过程中还创造了许多诸如此类的场景,并在每次训练中都确保两个机器人不能够同时达成最优结果。若机器人谈判失败,则会得到0分。换言之,谈判过程必须有,表现的好得分也高。
而更为有趣的是,FAIR在训练过程中还独创了一种名为dialog rollouts的模式。这种模式巧妙地运用了人类的心理学知识,使机器人拥有更强大的谈判能力。
具体而言就是,谈判机器人能够针对谈判对象进行心理建模,以便预先引导对话方向。此时,机器人会将没什么卵用甚至极具破坏性的交流引向成功。此种思路目前在游戏环境中多有应用,但被用于语言方面尚属首次。
在实际的谈判例子中,机器人还会“耍心机”:先对价值函数低的项表现出兴趣,之后通过让步做出妥协。这种招数类似于三十六计中的“欲擒故纵”,对机器人而言可以说是极富谋略了。
此外,FAIR团队还对人类间的谈判数据进行了众包,以便训练机器人进行大规模的量化评估,研究者在这些数据的基础上开发了一个循环神经网络使得机器人模拟人类的谈判方式。为了达到目标,FAIR实现了对事先构建的模型的数千次自我练习,并会对强化效果最佳的模型进行奖励。为了防止这种模型衍生出自己的语言,还对它进行了生成人类语言的相关训练。
在中国,也有具备猜度和分析人类心理功能的机器人出现。
在去年10月的云栖大会上,阿里云与互联网法律服务机构无讼网络科技联合推出了一款法律机器人“法小淘”。它能够基于法律大数据,实现智能案情分析以及律师遴选。通过对数据的分析,了解律师所擅长的案件类型及合理的收费区间,而后推荐合适的案件。
这类似于英国律师制度中专门设置的“Barristers'Clerk”这一职位。其职责是向律师介绍合适的案源,并制定职业规划。而“法小淘”不仅能担当Clerk的全部功能,还能针对法律服务的细分领域提供更加详细的建议。随着深度学习的进步,它甚至能提示律师工作中可能存在的风险。例如,当律师提交的证据清单与该类案件的过往证据提交情况不符之时,“法小淘”便会发出预警。
由此可见,科技确实赋予了人工智能更大的能力。
以前我们总说机器人还停留在“弱人工智能”阶段,但要是照这种趋势下去,强人工智能的到来可能就要加速了。不过,这依然不是那么容易实现的。
以谈判机器人为例。在中国社会中,没有关系可谓寸步难行,这也就是所谓的“在酒桌上永远比在谈判桌上更容易成事”。但谈判机器人则是完全依靠理性去进行评估的,用概率去分析,用数据去说话。更可怕的是,它还会“心理战术”。这种情况下,人类是很难占到上风的。