自从去年互联网女皇Mary Meeker 在发布的报告中提到,语音正成为计算接口,也是计算机输入最有效率的一种形式,人机交互的方式将发生变革。语音交互从那时起,就被提到的越来越多。
根据Amazon公布的最新消息显示,语音交互的代表——Echo的累计出货量已经超过1000万台,在美国家庭的渗透率达到5%。
这个小圆筒机器人体内的家伙“ Alexa”的技能已经超过了10000项,分分钟秒杀Siri——时刻听你说话,不用按按钮触发;通过蓝牙来播放音乐;从Amazon Prime上语音购买任何东西;可以语音追踪你的包裹而且你不用等到Echo的唤醒灯亮起来再说话
根据Alexa Skills Marketplace 的数据,Alexa10000 项技能中,被使用最多的Top 10技能是:
① 历史上的今天:是从 history.com网站收集来的每日历史知识。
② 睡前小故事:可以设置孩子们的名字,为他们讲一个大约一分钟的睡前故事。
③~⑤ 环境声音:雷声、海浪和雨声。这个技能只播放环境声音。
⑥ Jeopardy! J6:是一个来自电视节目的每日脑筋急转弯。
⑦ Ditty:会根据你的话语,做成一首歌。歌曲可以选择快节奏或慢节奏,或基于某个主题。
⑧二十题挑战:在20个问题之内让你猜测动物、植物等。
⑨ 好奇心:分享各种知识。
⑩ Inspire Me:提供每日格言。
另外,Echo最强大的技能是远距离语音识别和噪声抑制,你在家里任何一个地方呼唤Echo,即使有噪音,它都能听到,最远距离可达12米!这下Siri真的被啪啪啪打脸了。可怜的Siri只能在近距离且安静的环境中才能被你调戏。
VoiceLabs估计,2015年以语音为主要交互方式的智能硬件出货量为170万台,2016年的出货量达到650万台,预计2017年将有2450万台智能语音设备送到消费者手上,累计出货量将达到3300万台,市场规模超过200亿美元。从图中可以很明显的看出,以语音为主要交互方式的智能设备出货量的增速非常快,超过3倍。
目前,Amazon Echo毫无疑问在该市场处于绝对的领先地位。当然,后知后觉的Google也在后面穷追猛赶,谷歌直到2016年11月才推出了类似的产品GoogleHome,比Echo晚了整整两年。Google Home目前的累计出货量不超过200万台,距离Echo还有很大的距离。
美国市场在该领域比较典型的玩家就是Echo和Google Home,那么中国市场有没有类似的产品或者玩家呢?在这里我们选择了两家非常典型的玩家,一家是Rokid,另一家是叮咚。
Rokid是一家面向C端用户,提供新型家庭机器人助手和智能家庭产品的公司,其主打产品为Rokid家庭智能机器人以及即将正式出售的便携款Rokid.Pebble。
而叮咚则是由科大讯飞与京东合资成立的公司——北京灵隆科技推出来的一款智能音箱产品。这两款产品都是以语音为主要交互方式的智能设备。另外,不管是美国还是中国,这几家厂商都有一个野心——想做一款入口级产品,即智能家居控制中心(尽管目前中美两国都还处于早期探索阶段)。
美国市场较中国市场成熟!为什么?
从上面这张图中,我们可以对比一下中美主要厂商的出货量,可以很明显的看出Echo处于绝对领先地位,紧随其后的Google Home距离其还有很大差距。而中国厂商和美国厂商对比,我们发现这中间的差距非常明显。那么,为什么美国市场较中国市场成熟呢?
首先, 在 Echo 流行之前,已有一家叫 Nest 的公司将智能硬件普及到美国的很多家庭中。从“2016年中美用户安装智能家居系统的家庭数量对比图”可以很明显的看出,中国目前的智能家居产品的覆盖率还非常非常低,距离美国有15倍的差距。而只有智能家居产品的覆盖率达到一定程度,类似于Echo这种智能音箱的“语音控制智能家居产品”的功能才有用武之地,否则只会是一个多余的功能摆设。当然,不管是中国还是美国,也都在等这块市场成熟,显然中国等待的时间还会更长,小米等厂商的智能家居布局之路“任重而道远”。
其次,美国用户已经养成了为内容付费的习惯,他们非常重视版权保护。虽然从去年开始,中国的内容或者知识付费被提到很多,但是让用户、尤其是普通用户养成为内容付费的习惯还有很长的路要走。目前由于国内智能家居市场还远没有成熟,所以用户对通过智能语音设备控制智能家居的需求度还很低,更多的用户会拿这些设备去听音乐、听故事或者是书籍等。但是由于近来版权收紧,这些智能语音设备厂商要么与版权方在资源上有合作,要么就需要为版权付费,然而设备厂商又无法通过内容从C端用户身上收到钱,这就很尴尬了。
所以,国内厂商目前还处于非常早期的探索阶段。即使京东和科大讯飞两强结合,“渠道+技术”优势都已经具备,但是做得还是不温不火,这与国内大环境和用户习惯有非常大的关系。
即使是在美国,Echo目前常用的功能也就是播放音乐、控制智能灯、定闹钟、读新闻等。这些常用功能和控制智能家居,成为入口级产品的野心相差还是非常远的。在美国尚且如此,在中国就更不用说了。
Echo为何能占据绝对领先地位?
Echo的成绩前面也已经提过了,目前的数据非常亮眼,所以我们也有必要来总结和复盘一下,为什么Echo能取得如此好的成绩。
第一、Amazon对Echo的支持力度和决心非常大。Echo的内部研发工作从2011年就已经开始,并且之前在硬件(Kindle等)方面就已经有一定的积淀,随后吸收了语音识别公司Nuance的部分员工,并且还收购了两家语音技术公司Yap和Evi。等到Echo正式面市的时候,Amazon又不惜投入重金在各大渠道为Echo宣传和促销,同时还将Echo放在Amazon电商网站的显眼位置,从而获得了巨大的流量。而Echo的研发团队也在不断扩大,目前整个团队已经超过1000人。除此之外,Amazon的CEO贝索斯对于产品近乎严苛的要求,例如:要求将Echo的反应时间控制在1秒。
第二、Echo寻找到了一个正确的“引爆点”来激发消费者的购买欲。超过 40% 的早期测试者说他们使用 Echo 主要目的是听音乐。然后研发小组加倍投入精力,把音乐设计为 Echo 的主要功能之一。在人工智能还处于“弱智”阶段时,以“智能音箱”的逻辑切入,用户可以通过语音来播放音乐,能够降低用户的期望值。并且Echo是第一款能通过语音(远距离拾音)来控制设备的产品,正如iPhone面市时的触摸屏方式,对人机交互方式做出了一定的变革,能够给用户带来新意和好奇感。再加上价格也不算很贵(最高价:179.99美元,约合1250人民币;最低价:49.99美元,约合345人民币),所以用户会很愿意去尝试。
第三、围绕语音交互设计产品。Echo只提供语音一种交互方案,除了扬声器和麦克风,Echo没有其它交互接口。Echo“强迫”用户使用语音与设备互动,教育用户,培养用户的使用习惯。
第四、硬件设备(Echo)+软件服务(Alexa),打造生态体系,建立数据壁垒。Echo成为Amazon将智能硬件产品铺到千家万户的“杀手锏”,Echo的数据表现也让人们看到了以语音为交互方式的智能硬件时代已经到来,这就为Amazon开放基于Alexa的软硬件开发者平台提供了良好的基础。Alexa Skills呈现出爆发式的增长,目前的Skills已经超过10000种。同时,接入Alexa的智能硬件设备也在快速增长,比如:华为美国版Mate 9手机就内嵌了Alexa语音系统等。整个生态体系的搭建离不开最初Echo的推出。而Echo的大规模铺货以及生态体系的搭建,又能为Amazon带来大规模的数据,尤其是专业领域的真实场景数据和实时数据,从而将Alexa训练得更加“聪明”。
C端是一场巨头的游戏:抢占语音交互市场的赛道
我们可以看到,现在绝大多数人工智能领域的创业,尤其是语音交互、语义识别领域都是在走B端路线,因为走C端路线一方面需要直面巨头的竞争,另一方面是技术不成熟以及应用场景和需求尚不明确,这又是一场烧钱的游戏,创业公司想要去玩转,挑战非常大。下面是我们列出的基于语音交互的智能硬件领域的典型玩家和潜在进入者。
最上面是已经进入该领域,并且有比较成熟产品面市的四家典型公司/产品。我们可以看到,后面三家都是巨头推出的产品,只有Rokid是一家创业公司。但是Rokid这家公司也比较特殊,其创始人Misa之前创建过一家公司叫猛犸科技,后被阿里收购,他携团队加入阿里,并成为无线事业部M工作室领头人,负责深度学习、视觉和自然语言处理研发。2014年,Misa从阿里出来进行二次创业,创立了Rokid,该公司在2016年9月完成5000万美金B轮融资,据传最近又引入了阿里巴巴的战略投资,从Misa和阿里巴巴之间的渊源也可以猜测到。在一场世界级的竞争面前,找个“干爹”还是有必要的。
另外,Amazon Echo和Google Home还没有进入国内,一方面由于中文语音/语义识别和文化差异导致,另一方面中国的防火墙将国外厂商给“无情”地挡在了外面。那么,国内市场中目前主要的厂商/产品就是Rokid和叮咚了,同时也还有不少潜在进入者,例如:小米、华为、百度等也在觊觎这块市场。但是就目前整个市场阶段来看,还处于非常早期的教育用户和培育市场阶段,各厂商当下最重要是要找到中国市场的“引爆点”或者是应用场景,同时去打磨产品,等待这块市场的爆发。所以现在谈竞争还为时尚早。
国外的微软、三星、苹果这三家巨头也一直在盯着这块市场。微软和苹果据传一直在研发类似于Echo和Google Home的产品,但是这两家巨头也可能从其他角度切入市场。例如微软的HoloLens VR头显,目前也支持语音控制VR体验;苹果的无线耳机AirPods,支持通过Siri来控制。在推出的短短一个月内,苹果AirPods就占据了美国无线耳机26%的市场份额。而三星在2016年8月也被曝出正在做类似于Echo的智能音箱,并且其新品Scoop的设计图还在网上被曝光,但直到现在该产品也没有正式面市。同时,三星也在2016年10月收购了AI助手系统Viv公司,而其联合创始人正是“Siri之父”。并且在2017年3月,三星在 Galaxy S8 问世之前,率先公布了内置于手机之中的人工智能助理 Bixby。
可以看到,不管是国内还是国外,巨头们都纷纷在语音交互市场抢夺赛道。尤其是面向C端用户提供以语音为基础的智能硬件市场,巨头林立,创业公司涉足会面临非常大的压力,但是面向C端用户的市场想象空间更大,如果创业公司能够找到具体的落地场景和应用,并且对于团队、资金、技术、资源等各方面都足够自信,或者能够伴上“干爹”,涉足C端市场也是很好的选择。但目前对于国内的大多数创业公司来说,针对B端客户或者是垂直行业输出解决方案是更好的选择。这样可以避开巨头的直面竞争,在技术发展早期段弥补产业的薄弱环节,现金流情况会更好。
另外,语音和视觉目前还被分得比较开,但是长远来看,语音和视觉在AI领域一定会统一,因为这更符合人的自然习惯。这也是为什么VR/AR会火的重要原因,VR/AR最后也会将语音统一进去。
所以,国内厂商也不能照搬Echo的经验,毕竟中国目前的智能家居市场还处于非常早期的阶段,同时还有用户使用习惯以及文化差异等原因。而且对于下一代产品形态的定义,即使是Echo,目前也都在“摸着石头过河”。虽然Alexa平台上面已经汇集了很多开发者,但是用户常用的Skills还是非常少的,Alexa想成为下一个平台还有很长的路要走。对于国内厂商而言,还得去找到适合中国市场的应用场景和需求,同时去钻研技术、打磨产品,等待市场的爆发。