李根 发自 凹非寺
本文经AI新媒体量子位(公众号 ID: QbitAI)授权转载,转载请联系出处。
△ 第五代微软小冰将“无处不在”
2017年8月22日,第五代微软小冰发布,宣称要“无处不在”。
可微软小冰是谁?一个聊天机器人?“可爱小美女”?一个会撒娇讲段子的AI?
她现在能做什么?未来又将去向何方?之前确定性存疑,但这次有了答案。
第五代小冰
我们先看下第五代小冰都有了哪些新特性。
这一代小冰将上线高级感官功能——能主动发起对话,甚至主动给骂她的人回追电话;
新增使用生成模型(Generative Model)——可以自主生成对话内容,以前都是语料库里“搜”现成的;
要进军IoT展开落地合作——存在的载体一下子大大拓宽了,可以“活”在手机App里,也能“活”在音箱里,甚至冰箱、电扇都不是问题;
可以参与创作有声读物生产——除了语音识别和合成,还结合了一把音乐方面的能力,快速完成一个“声情并茂”的作品;
△ 第五代小冰有声读物《龟兔赛跑》
最后,加速与搜索引擎Bing的融合,既要加速人与世界(信息和服务)连接,还能以智能助手的身份参与新内容的创造。
更像人了
在第五代小冰新特性公布后,你是否也会觉得这个一开始就被人设“少女”的AI更像人了?
依靠高级感官功能的赋予,小冰终于可以主动发起对话了,不再是一个呼之即来挥之即去的“机器人”工具。
这其实非常不简单,并非一蹴而就。
“微软小冰之父”李笛说,第一代、第二代要做到有趣,能够让人有的聊;第三代小冰要有情趣,可以让人聊下去;第四代小冰则能探测,知道用户的偏好和兴趣。
到了第五代,要主动发起聊天。这种主动如何实现?更高级的感官。
其实在第三代小冰中,就已经不断有了感官的引用。只是第三代小冰,引入的是初级感官,通过核心对话引擎的使用,可以混用不同的感官,比如自如切换图像、语音和文本等。
第四代小冰则迭代至“全时感官”,与人类的无缝流畅对话,甚至根据聊天内容与走向进行打断与追问,甚至能够让AI与人类打电话。
到了当前第五代微软小冰,更高级的感官则让“全时感官”里的“打电话”变得“对讲”一样。
第五代小冰能够主动发起通话,能够通过声音感知人类情绪和周边环境,报之以相应的聊天话题和语气。
更形象的比喻如李笛玩笑所言,第五代小冰开始,假如再有人在微博、微信上骂小冰,小冰完全可以半夜12点电话“报复”——不仅有EQ,还有了行动能力。
但小冰更像人的背后,却加速摆脱对人类数据的依赖。
告别数据依赖
小冰诞生在微软,成长到现今模样,其实并不容易。
众所周知的是,AI技术的三大底层基础是:算法、计算力和大数据。
但对于微软来说,最关键的数据部分需要后天努力。由于在移动互联网时代的“错失”,特别到中国市场,微软缺乏产品与人类用户交互的第一手数据,这让小冰“喂养”成为最现实的挑战。
不过回溯来看,此前并不擅长直接与C端用户打交道的微软工程师们,却创造出了一种新模式——让用户领养小冰,并在交互中不断获取交互数据,帮助小冰模型框架的成长。
现在的局面是:微软小冰拥有超过1亿的用户,超过300亿的人机直接对话,还有海量的语音、图象、视频的交互数据,在国内所有其他的对话是人工智能产品加起来的对话数量都还不到小冰的1/10。
微软小冰首席架构师周力评价说:这好比有1亿的用户在共同抚养着小冰。他们可以教小冰掌握更高的对话技巧和EQ,事实上没有哪个人类的孩子享受过这样成长的机遇。
这样的数据量也让小冰这个AI计算框架实现了量变到质变的跨越。
五代小冰以前,她说的每一句说,都来自10亿量级的语料库,都是“搜索”记录在案的人类语料库做出的决策,但自此往后,微软小冰将自主创造回复的内容——不再鹦鹉学舌,和你说的每一句话,都有可能是在这个世界从来没有出现过的。
这就是生成模型(Generative Model)。
这个模型不仅能自主生成回答内容,还可以让快速构建其他形色各异的聊天机器人成为可能。
也就是说,“18岁少女”的人设也能快速有个其他的变种,下次出现个“35岁大叔”之类的……有意思的是,小冰团队在今年愚人节期间,已经把日本小冰切换成了一个男性角色,并取得了不错的反馈。
△ 小冰内容及运营总监徐元春介绍小冰“读书”
打破版权限制
生成模型当然还有更广阔地用途,特别是自主创作方面。更早之前,小冰出版了自主创作的诗集,这是人工智能在原创内容方面的重要一步。
但随着高级感官、生成模型等技术的使用,第五代小冰还被“获准”进入更多的领域,其中发布会上大书特书的就是“有声读物”领域。
这也将造成一部分以此为职业的人类的“转型”。
以《格林童话》为例,如果人类选手生成一版50小时长的《格林童话》有声读物,需要耗时至少200小时,金钱成本62100元,但如果让小冰来做,可能只需要24分钟,花费7毛钱。
这将是一个行业地震式的变革。但微软小冰团队也强调,小冰更多是“协作者”的姿态出现,而不是“替代者”,不会完全替代人类在这方面的职业机会,但能够协助生产更多优质的有声读物内容,为人类服务。
其实隐而未宣的是,拥有这般能力的小冰,可以帮助微软打破内容领域的版权问题。
如今AI助手正在加速IoT设备智能化,但和智能音箱遇到的问题一样,软硬件问题解决后,最终核心比拼的将是“内容生态”,这意味着狭路相逢版权者胜。
没有那么多版权怎么办?比如“有声读物”领域,总不能高价邀请声优一个个录吧?
现在小冰能做,一切都不再是问题。这个不眠不休,有“音乐修养”、又兼具朗读能力的机器人,将指数级创造更多的资源出来,版权主动权也都将掌握在微软手中。
当然,与“有声读物”类似,音乐版权的路径可能也会被重构。虽然之前已经有过歌曲发布,但第五代小冰展现出的“歌喉”,已经没有“机械感”了,不信可以通过QQ小冰“索要”一首《我是小冰》听一听。
更有意思的是,在发布会上,微软团队认为小冰在唱歌方面的造诣,已经甩开知名虚拟偶像“初音未来”了。
可能需要担心的是真的会有人爱听小冰唱歌吗?
柯洁估计会。在央视和长江文化联合出品的节目《机智过人》上,这个今年还在乌镇与围棋AI AlphaGo厮杀的围棋少年说:我是微软小冰的粉丝。
△ 小冰&智能家居
拓展生存空间
高级感官、生成模型,可以自主或参与创作内容,这些都是进军IoT存在的顾虑,现在既然都已秋风扫落叶,是时候拓展微软小冰的生存空间了。
微软小冰产品总监彭爽宣布,小冰将借助小米IoT平台米家,开始“入驻”家庭,除了通过小冰操控家中的智能设备,还能有一种“打电话”的感觉,即交互更自然,并非命令式对话。
而且小冰还会兼具身份识别的功能,对家庭成员中的“爸爸”、“儿女”、“父母”等都会有不同的用语和语气来进行交流。
此外,除了小米IoT平台米家,微软小冰还将与小米生态链企业Yeelight推出智能灯产品,与互娱领域的东方明珠推出一款暂未透露的“神秘”的家庭场景的产品——更早之前,微软小冰的代表还出席了广州东方数智科技有限公司的成立,这是一家与东方明珠达成“IP+AI”战略合作的新公司。
小冰团队希望的,正是在整个IoT场景中,让小冰时刻被感知,被当做家庭中的一员,用户可以和轻松地跟小冰进行交互,既可以控制设备,也可以随意地聊天。
△ 小冰电台
不过既已迈出“空间拓展”的一步,另一些空间的拓展也被展开。此次发布会上,另一个落地的产品是“小冰电台”,小程序版本,说新不新,但已经摆脱第三方音乐平台独立了。
小冰电台可以基于多重来源,面向各种主题,自主创造节目:讲段子、播放歌曲、互动交流,都可以是这个电台的主题,其实与人类电台已经没有实质区别,只是小冰不用休息也不用发薪水而已。
量子位抢先试听了“小冰电台”,当我告诉小冰“我要当爸爸了,来点音乐吧”的时候,她给我来了一首“千千阙歌”,并深情款款地说“这是我妈妈最爱听的歌曲。”
整体来讲,小冰电台的体验还是非常不错的,如果有缺点,可能是“歌曲版权”方面,她现在的曲库资源完全来自“咪咕”。不过依照小冰的能力,日积月累,这必将会成为最了解你音乐喜好的智能助手。
△ 小冰之父李笛
商业前景
既然可以成为音乐方面的智能推荐助手,那更多的领域自然也不是问题。小冰的商业化还是问题吗?
小冰之父李笛说,同样的技术能力,应用到音乐之外的其他内容领域和服务领域,完全不是问题,一篇新闻?一部小说?一个餐馆?原理都是一样的。
实际上,小冰已经在日本试水过了。
小冰去年在日本,基于LINE和Lawson一起合作,测试了一把小冰在“卖”打折券方面的能力。
具体任务是小冰在LINE上,和Lawson2000万左右的用户进行交流,在对话过程当中发现机会,把Lawson的打折券提供给这些用户。最后测试的结果是4日内使用打折券的转换率为57%——之前任何方式都没有超过10%。
李笛说,这就是AI在EQ方面的力量。
小冰是如何做到的呢?对话记录这样显示:当一个用户偶然和小冰说饿了的时候,小冰不会直接推荐营销券,她会先通过漫无目的地交流,在多轮对话后,悄无声息引导用户去向小冰要打折券。
“在整个的对话中,小冰不停地在用她的各种方式,暗暗地去判断这个人是不是需要打折券,以及需要什么样的一张打折券。同时还不停地激发这个人对某一种食品的热情。所以这也是为什么小冰能带来这么高转换率的原因。”李笛解释说。
这样的尝试也让微软小冰团队认为找到了一种平衡技术和商业的方法。
“在人工智能的时代百舸争流,大家都在主流的发掘人工智能本身存在的价值,与此同时都想要去发掘它的商业目的到底如何实现。但是我们从一开始一直到现在,甚至到未来很长一段时间,我们都希望人工智能首先能够成为对人类有益的一种存在,而不是在发现你失恋的时候马上给你推一个“好利来蛋糕”,你要不要吃这个东西,实现我的五外卖目标。”
所以小冰的商业化未来到底会是什么样的呢?不知道。
但小冰团队的目标已经非常明确:以EQ为基础,当小冰把她所获得的来自世界的知识、内容和服务,以一种更快的、更高转化率的商业价值的体现推送给人类的时候,她和人类的情感纽带同时能够因此而加深。
一定程度上,这也是小冰(小Bing)起步的核心原因:加速人与世界的连接。于是不太意外的是小冰将在媒体信息、搜索等方面实现的“大Bing小冰”融合。
△ 沈向洋说:借助AI,与Google再争高下
媒体变革 搜索进化 反击Google
小冰在新闻媒体领域大展身手已不是新闻。在此之前,小冰已经为《钱江晚报》撰写了不少新闻,而且源于机器在“知识图谱”方面的能力,可以对于某个新闻事件的前因后果、左右关联更为熟稔,于是可以预测重要事件的结果。
在五代小冰发布会上,可能同样处于“尊重人类”的考虑,小冰团队在这方面还是用了“协作”,而不是“替代”记者。
但毫无疑问的是,那些“跑得快”的快讯、消息类记者,将实实在在被机器替代。而更多深度内容、非虚构创创作等方面的记者,则确实可以让小冰帮助完成“功课”环节,她能够从海量网络世界中收集整理相关资料,帮助人类记者更快完成对某个事件的认知。
小冰在媒体领域的“大展身手”还包括在交互上,一个更加精准的“搜索机器人”将进入媒体App、微信和微博等平台中,通过对话式窗口,帮助你找到想要了解的内容。
当然,类似的方式也将被微软复制到搜索领域。小冰(小Bing)将和大Bing加快融合,为每一个新闻数据构建“知识图谱”,帮助用户更快速全面搜索想要找到的内容。“推送”为王的AI新媒体变革也可能就此被打破,主动交互式的信息交换可能又要回潮——但已经是完全不同的主动阅读体验了。
微软还希望借小冰打一场搜索领域的反击战。
当前Bing在美国拥有33%的市场份额,在中国,英文搜索流量占比22%,微软希望借助大Bing小冰融合,以搜索体验提升为吸引力,向老对手Google发起新一轮挑战。
微软全球执行副总裁、微软AI研究事业部负责人沈向洋说:依靠AI,构建知识图谱,未来在很多市场,完全可以跟Google一争高下!
限时干货下载
Step 1:长按下方二维码,添加微信公众号“数据玩家「fbigdata」”
Step 2:回复【2】免费获取完整数据分析资料「包括SPSS\SAS\SQL\EXCEL\Project!」