专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
新浪科技  ·  【#研究表明失重下精子会迷失方向#】#人类能 ... ·  19 小时前  
新浪科技  ·  #进博会央企大采购#【#直击进博会# | ... ·  1 周前  
51好读  ›  专栏  ›  雷峰网

为何中国版 Echo 还未问世,明天阿里的 AI 新品能带来惊喜吗?

雷峰网  · 公众号  · 科技媒体  · 2017-07-04 22:04

正文

300 + 明星创业公司,3000 + 行业人士齐聚全球人工智能与机器人峰会 GAIR 2017,一同见证 AI 浪潮之巅!目前仅剩少量余票,有需要的朋友抓紧了。

不可否认,在技术落地、市场洞悉力上,亚马逊很多时候都远甩其他对手。 


智能音箱的缘起

拿现在热的发烫的智能音箱来说,早在 2014 年,针对智能家居细分市场,亚马逊就发布了智能音箱硬件产品 Echo。

连贝索斯都没想到的是,经历 Fire Phone 惨败后的亚马逊的这款智能音箱却成了市场新宠。据不完全统计,截至目前,Echo 的销量已达一千万台,更不可思议的是,亚马逊的股价也由此创下历史新高。

从这开始,智能音箱之火彻底被点燃了。它成功地引发了 2017 年智能硬件市场上的最大风暴,在很短时间内便引发其他巨头相继入局。

很快,战火也烧到了到大洋彼岸的中国,精明的中国商人当然不会放掉这次机会。据雷锋网不完全统计,国内目前已经有近百家大小小的公司开始打起智能音箱的主意,进击内容大消费市场。 

智能音箱为啥火了

都知道智能化将会带来新一轮的行业洗牌。但谁都想不到,几十年后,音箱行业也会被一群互联网公司所取代。但雷锋网好奇的是,偌大的智能硬件市场,为何是智能音箱独得宠爱。

从产品角度来说,主要基于几点。一、价格相对便宜,和电视等大物件相比,用音箱做智能家居控制中心比较容易入局;二、需求较高,听歌娱乐已经成为人们茶余饭后必须的休闲活动,而音箱的接受度及普及率相对较高;三、体积较小,占地空间小。

从市场角度分析,一切都源自交互入口。

喜马拉雅副总裁李海波告诉雷锋网,未来的 20 年内,“互联网 +” 将变为 “AI+”。人工智能会深刻改变各个行业,首当其冲的是内容产业,而从这块来说,以语音作为家庭交互切入口将成 “最佳捷径”, 他解释说,随着整个 IOT 产业崛起,人们都在企盼一种与机器更自然的交互方式,而语音无疑是最佳入口,因为它最顺应人性(看看世界上有那么多阅读障碍者便知)。它与之前的触屏带来的移动互联网一样,属于平台级机会。现在智能音箱 AI 时代交互入口的概念被更多人所意识到后,没有人愿意在智能手机之后的下一个平台级机会前被抛下。

声智科技联合创始人李智勇认为智能音箱市场变得火爆的直接原因是海外四大科技公司同时入局(这在触屏手机之后是仅有的一次),更深层原因是大科技公司意识到了人机交互变革背后所蕴含的庞大能量。这种力量是非常颠覆性的,想象下如果微信不来自腾讯,那腾讯今天很可能只是个百亿市值的公司。这类通用型产品,大公司全线入局是必然的。

而此前在接受雷锋网的采访中,欧瑞博首席增长官李婧也认为,巨头混战智能音箱市场背后是看中了其 “语音交互” 功能。其逻辑在于,希望能以语音为突破口,把 “音箱” 作为中枢,通过智能音箱和语音技术,以此来搭建智能家居生态体系。

从国际市场上的智能音箱产品上看,语音交互在智能音箱领域早已被运用多时。与做一款单纯的智能硬件音箱相比,获得庞大的用户数据和掌握软件服务入口,以及建设属于自己的核心生态,才是科技巨头真正看重的。 

为什么国内做不出一款爆品

如果说企业趋之若鹜地发布智能音箱都是看重了其重要的交互入口从而布局智能家居大生态。那么,多年来如此多的中国厂商入驻,为什么还是做不出一款爆品?

在欧瑞博首席增长官李靖看来有两方面原因,一方面是因为用户群体对于智能音箱这个产品不感冒;另一方面,国内的智能音箱市场,目前还没有一款拿得出手的 AI 智能语音助理产品能够搭载在智能音箱上实现软硬结合与并具备相对较好的语音交互体验。

声智科技联合创始人李智勇也给出了他的看法。他认为现在还没出现爆品的最关键原因是因为产品还不好用。他认为语音交互这事必须整体上跨过某个临界点,否则就不好用。第一关键是反映速度、交互精度、唤醒率、误唤醒率必须过某个界限,这是硬门槛。然后是要匹配足够搭的内容,让用户确实感觉到可用性。这两者都整合好了,才是最终的体验。

笔者认为,除了以上两位专家所言,音箱 “革命” 的受阻因素包含有很多,出现不了类似于 Echo 爆品的因素也有很多。

一、技术积累不足,产品打磨不够

智能音箱作为语音智能助手的家庭入口,远远超出了音箱定义的范畴,它涉及了语音交互的完整生态链。其中的软件技术的落地并不是一蹴而就的,它需要相当长时间的累积。

正如基于 Alexa 的 Echo 所成功关键,其实更在于较早的语音技术生态的布局。这个阶段很像 Android 上线后,从 1 万个技能发展到 10 万个技能的阶段。Echo 正处在快速发展的阶段,在语音识别、麦克风阵列、降噪、语义理解,均已经实现全站语音交互。目前,Alexa 已有 12000 项技能,并主要致力于做开发者生态。这是其他玩家现阶段无法比拟的,或者需要很长一段时间才能追赶上。

事实上,Echo 的诞生也并非一帆风顺,Echo 智能音箱是由亚马逊数百技术人员历时三年才打磨完成;苹果 HomeKit 在推出之后就硬软件适配上就花了两年之久,相比之下,国内很多智能家居小厂商由于体量问题,往往接不到功能较为强大的软硬件资源;也有某些厂商为了赶上这个风口,在几个月时间内,通过跟一些第三方语音方案和硬件公司的合作,迅速把产品从图纸设计转为实物上市,虽然看起来能用,但整个交互以及体验欠佳,缺乏对使用场景的了解和对用户行为和心理习惯的研究。

另外是缺乏合作。就此,声智科技创始人 CEO 陈孝良坦称,拿语音交互来说,国外巨头不断收购相关公司壮大实力,而国内公司总是喜欢自家组建小团队搞定一切,试问精力如此分散如何才能超过国外的巨头?何况语音交互压根也不是搞搞深度学习就能解决的,这本身就需要对声学和智能都有深刻的理解和长期的积累才能做好。

二、音箱内容资源匮乏,缺乏用户粘性

在大数据规模、用户积累以及软件生态整合方面做得不够,用户选择一款产品,看中的不单单是智能硬件,更重要的是背后的服务和内容。而在上下游生态闭环这块,很多公司稍显能力不足,内容打通的还远远不够。

中金公司研究部 2 月的报告以亚马逊的智能音箱 Echo 为例,指出智能音箱已经从早期用户的小众圈子进入大众市场,这不仅归功于语音助手平台 Alexa 的语音识别技术优势,越来越多的第三方应用使其可为普通家庭带来实用价值是更为根本的原因。

引述美国统计机构的数据称,音乐流媒体和图书、家庭自动化、新闻和播客等,成为 Echo 最经常使用的第三方应用。目前,亚马逊向超过 12000 个应用开放了语音助手平台,其中也包括游戏应用和亚马逊的合作商户,比如餐厅或比萨店。

而 HomePod 则充分利用了苹果的内容资源。据雷锋网了解,HomePod 将集成与智能家庭的交互中心。该设备将包括 Siri 集成功能,它能够像 iPhone 一样响应查询,可以阅读电子邮件、发送信息、阅读推文,以及与 iOS 深度整合来提供提醒、通知等功能;并作为智能家居的中心,控制灯、插头、门锁、窗帘盒其他智能设备。另外还面部识别功能。音箱可以通过这些识别家庭成员,并进行语音交互。

让人无解的是,浓浓的 iphone 风在 HomePod 上也得到了延续,对于第三方的权限被完全锁定,苹果 HomePod 目前只支持自家的 Apple Music 服务,而这的确会让 Spotify 或 Pandora 的用户感到失望。

上述观点详细地解释了为何中国至今还没有爆款产生。另外数字家圆 CEO 唐波也补充说,目前国内的智能音箱厂商实力是有的,但还是过于急功近利。基于 AI 的智能音箱产品的链条其实很长,任何一家创业公司不可能将其从头做到尾,如今正值市场的培育期,相关厂商应该优势互补,步步为营,让自己的产品在国内获得口碑。当消费者对智能音箱有了更正向的认识且抱有更大的期待时,也会是智能音箱真正要繁荣的时代,这是一个长期的拉锯战,不可能短期内解决战斗。 

除了后天短板,在还未能制造爆款的问题上,中国在有些方面也存在一些 “先天不足”。

一、自然语言处理(NLP)

智能音箱的落地过程中,NLP 技术发挥了很大的作用,但有一点必须弄清楚,东西方由于文化的巨大差异,其语言表达方面也存在巨大的差异。而这种差异也决定了类似 Echo 这类语音智能助手的普及速度。从实用文本分析技术而言,中文要分词,英文不需要;从 NLP 研究角度而言,中英文在词性标注、句法分析等任务上颇有差异,中文相对歧义更多。但由于这些机器语言都是以英文处理,因此,在相等前提下,机器处理中文要复杂的多。因此,中国厂商在应用这些技术时,必须得让 NLP 更好的理解中文,而这无疑增加困难度,更何况语言是个性的、场景的和情绪的。而从这点来看,外国厂商就相对轻松的多。

二、用户使用环境

总体来说,国外在薪资和独套大房的比例上比中国高很多。在此条件下,花费相当少的费用便可以让整个家庭都可以享受最新的科技,何乐不为?相对国内,除了智能手机、手提电脑等必备物品,其他类的智能硬件产品由于各种原因还不能触碰到人们的购物欲望。所以就目前需求来说,中国市场还不是那么旺盛。 

阿里巴巴能否带来新活力

巧合的是,在中国迟迟制造不了爆款的局面下,多种证据表明阿里巴巴将于 7 月 5 日发布首款智能音箱,如果该音箱成功发布,毫不夸张的说,这将是最有可能对标亚马逊 Echo 的产品。

看来,阿里巴巴这次是有备而来了。

有意思的是,在发布会前夕,阿里巴巴智能音箱提供技术支持的团队也首次曝光了其自然语言处理成果。一篇自然语言处理(NLP)的相关论文《一种新的语义编码模型及其在智能问答及分类中的应用》被国际数据挖掘顶会 KDD2017 收录。在自然语言处理的两个核心应用场景 ------ 文本分类和智能问答上,阿里巴巴这套即刻唤醒,即刻识别神经网络模型的智能问答准确率相比微软的 wikiqa 数据集和 IBM 的 insuranceqa 数据集提升了 2-4%,是目前业内最高水准。而上文也提到这项技术恰恰是语音交互最核心的技术。

阿里智能音箱也许并非应用于生活场景

雷锋网分析,基于阿里巴巴的电商属性,此次发布的智能音箱理当应该利用淘宝、天猫资源主打购物功能,但从整体市场来看,此块还不成熟。从雷锋网 (公众号:雷锋网) 此前采访科大讯飞胡郁可得知,真需求一定是用来满足用户刚需行为的功能。虽然 Echo 现在卖的很好,但调查后发现,用户真正用得比较多的工具不过是设个提醒、查个天气等等。之前亚马逊大力推的 Echo 语音购物功能并没有做起来,当用户用语音交互的形式去买东西时,会发现里面各个环节和场景挺麻烦,还不如直接在屏幕操作来的方便。

所以这也是很多企业一直在强调语音交互要和视觉呈现的原因,因为用户在面对没有视觉呈现的情况下,你获得的信息不够,这时候很难完成一些复杂的操作。所以有些功能和场景都是我们自己凭空想出来的,直到真正投入实际使用时却发现用户的思维与行为习惯并不是产品设计的那样。

基于此,雷锋网认为,针对亚马逊的 “前车之鉴” 以及阿里此前在 NLP 方面的技术积累大多针对淘宝客服、蚂蚁金服等工作导向的内容;再包括阿里在很多包括语音等细分技术领域与百度、科大讯飞等公司还有差距等因素,我们有理由猜测阿里巴巴此次发布的智能音箱更有可能或者更倾向于针对工作场景。

究竟是怎样,明天见分晓。 

结语

目前,以亚马逊 echo 为代表的智能音箱产品让我们有理由相信,基于 AI 的智能硬件产品也可能是市场的真实需求。对于国内市场,经过几年沉淀,已经到了各路英雄放完大招见分晓的关键节点,在这番智能音箱的较量中,谁能够实现自我进化的野望,拭目以待。 

CCF-GAIR 2017


全球人工智能与机器人峰会

将于本周 7 月 7 日 - 7 月 9 日在深圳举行,

目前仅剩少量余票,有需要的朋友抓紧了


点击「阅读原文」立即购票