垂直的AI千篇一律,通用的框架万里挑一。
人工智能AI应用众多,在不少数人眼中,相较Google alphago围棋大赛的风光,IBM Watson医疗领域的担当,甚至是科大讯飞的智能翻译,旷视的智能安防……聊天机器人目前的应用被视为“区区”二字似乎也不为过。
但业界科技巨头却不是这么想的。
当亚马逊
Alexa
被看为语音助手界的搜索引擎时,
Alexa
为了
和人类交流
20
分钟而巨额投资研究机构,向聊天机器人方向不断冲刺;最晚问世的
Facebook-M,
定位同样也远离语音助手而直捣聊天机器人角色;最早出现的微软
Cortana则一直定位
智能助理,她的
“好姐妹”小冰如今已进入第七代;还有谷歌的聊天机器人Google Duplex和Allo……不论其中是否已经有项目搁浅,但不妨碍各大顶尖科技企业在项目上另起炉灶,继续聚焦聊天机器人。
为什么一度被忽视的聊天机器人突然进入了AI焦点视野?
究其原因,就在于表面上的聊天机器人,背后却是AI的通用框架,这甚至代表了AI的未来。近日,
微软(亚洲)互联网工程院副院长、小冰团队的负责人李笛接受了科技茱比莉的独家访谈。
借用“好看的皮囊千篇一律,有趣的灵魂万里挑一”,审视市场上各种打着AI(人工智能)旗号的应用现象,可以概况为“垂直的AI千篇一律,通用的框架万里挑一”。
大多数企业都在做AI领域的垂直应用,这里有两个含义:
其一,
AI的技术类别划分,基本可以分为
自然语言处理、计算机语音,计算机视觉、知识图谱四大类。市场上很多
AI企业都有专攻的方向,比如人脸识别为代表的图像处理、自动翻译为代表的智能语音。
其二,AI的行业垂直应用,比如无人驾驶,智能安防,这是AI+传统行业所产生的巨大价值。
AI的垂直应用并非不重要,恰恰相反,它通过聚焦AI的技术精专和商业需求,在现阶段带来了巨大的市场和商业的成功。但另一方面,垂直领域AI也容易
倾向于
“
千篇一律
”,即通过最基本的缩小外延的方法
不断简化问题,将问题狭窄到一定程度之后,
AI便
可以自洽。但这个程度如何掌握?李笛认为:很多情况下,垂直领域
AI产品的最大
敌人不是其他
AI而
是移动互联网。
以互联网上的AI订餐机器人为例,如果你和AI沟通几个来回都没有完成订餐这样的简单任务,为什么不直接用移动APP上的订餐按钮?又比如,智能音箱如果只是完成一个语音点播,人机交互的AI时间只有2秒,其他时间都在听歌,仅仅作为渠道的AI又怎能在垂直场景下继续发展呢?这意味
着
AI
要想在垂直领域真正落地,必须要解决它和移动互联网相比是否真正具备优势,这也是各大语音助手走向聊天机器人方向的要因。
因此,AI的未来还有另一种思路——基于全技术栈的AI通用基础框架。
李笛认为:
AI时代是一个全新的未来时代,这就意味着这个时代很可能需要一个基础框架。而聊天机器人由于可以综合应用
自然语言处理、计算机语音,计算机视觉、知识图谱四大
AI技术类别,背后正是AI的通用框架,这也是为何它备受追捧的技术要因。
众所周知,通用框架本质上并非若干个垂直领域的结合。而绝大部分任务或者知识都是垂直且离散的,实际上是技能的结合,但这不等于通用。那么,通用框架应该如何构建呢?
在探究AI未来的技术和领域上,各家皆不相同,但就聊天机器人来看,一个重要指标就是CPS,即与用户单次平均对话轮数。以微软小冰为例,就其
在全球多个国家覆盖
6.6
亿在线用户、
4
.5
亿台第三方智能设备和
9
亿内容观众的庞大交互场景的情况下,小冰与用户的
CPS
保持在
23
轮。这意味着,小冰作为聊天机器人绝不是一问一答的对话那么简单。
据悉,小冰
通用框架中的一个维度就需要兼具
IQ和EQ能力。有意思的是,EQ该怎么理解呢?EQ并非情感化的表现,相反它
恰恰是纯理性的表现。李笛表示,这正是从事多年小冰项目后研发人员的感悟。在人类社会中,
EQ高的人往往在一对相对关系中
获利更多。因为
EQ高的人知道
如何取得对方的信任;而对于
AI
来讲,
EQ
不是控制对方,而是能够去控制
AI和人类
交互时候的关系。
比如,
AI
知道什么时候该拒绝对方。当你几次让小冰做同一个任务,她会认为你在测试她而拒绝你;你问小冰几点了,她可能会说:
“你不是拿着手机吗?”适当拒绝在EQ当中实际上是通过提示
你不能毫无成本地随意下达任务而
获得平等的对话关系
。
又比如,AI知道如何应对人类挑战心理的诉求。针对图像识别,一般AI会直接识别结果,但是人却会跨越识别过程,回答图像所表达的一种心理状态。当你将脚踝扭伤的照片发给小冰时,小冰
的回应深了一步:
“
脚踝伤得重不重?
”
这样的回应一出,你很难以挑战心理继续发更多测试照片,而是会接着这件事沟通下去,一个
AI视觉测试就演变成了一次人机交流
。
由此可见,算法不是问题,通用框架的模型是顶层设计的重中之重。在李笛看来,
AI往
垂直方向会越走越窄,越往后走难度越大;而具备
AI
通用框架虽然起步难,但将会越走越宽。
一种是上文提到的挑战心理,后果是直到把
AI
问倒,评价
AI不行再转身离开;
另一种则是
用户会习惯把自己的问题限定很窄的边界,比如每天让
AI开关灯
。
这两种情况都会造成垂直
AI应用的障碍,而通用框架的AI在具备
完整能力的基础上可以主动叠加新的技能,与行业和市场形成不断的正向激励过程。
以两年前小冰率先推出全双工的语音交互的感官为例,推出的原因是先有了可以上下文全程对话的核心对话引擎,而半双工限制了这个引擎的能力。比如
第七代
小冰最新又发布了多模态交互感官,即在全双工语音交互的基础上增加了实时视觉交互体验,同时
发布的还有
“
主导对话
”引擎,从平等对话走向主导对话,这意味着小冰可以主动根据上下文语义,甚至是周边的视觉环境主动寻找话题、发现问题
、主导对话。全双工语音交互、主导对话引擎、多模态交互感官三者提升组合才能产生更高的价值。
所以,框架的完整度决定了研发人员在任何一个角度,去思考为什么要研发新的技术?为什么要选择一个方向去演进这种技术?因为,通用框架之中的所有功能之间是互相支撑的逻辑。
另一方面,AI通用框架也应该具备高弹性,和开放的商业策略,才能形成技术和场景快速迭代下的正向激励闭环。
小冰的人设是
18
岁少女,但通过小冰
Avatar Framework
的第一个工具包版本的发布,使用者就可以按照自身的场景和设定去构建具有完整情感计算能力的
AI
助手、社交对话机器人、人工智能内容创作和
IP
人物角色。据悉,微软已经通过
Avatar Framework
框架赋能软银
Pepper
等数十个第三方
AI
Beings
,在内容创作方面还与阅文集团及旗下红袖读书开启
“
IP
唤醒计划”,是人工智能技术携手网络文学以来最大规模的
AI
赋生
IP
角色,阅文集团旗下
100
部小说主人公
IP
已在红袖读书
APP
中同时上线,意味着
Avatar Framework
赋能虚拟
IP
量产化加速。
一个具备弹性的
AI
通用框架,衍生出不同场景的
AI Beings
,这样的
AI
商业之路会越走越宽,AI技术之路才会越走越长。
科技茱比莉 原创出品
公众号转载需注明来源
科技茱比莉
有视角的科技观察 有态度的科技评论