专栏名称: 智慧产品圈
营造智慧产品生态圈
目录
相关文章推荐
基民柠檬  ·  行情来得太快,指数基金都跟不上了? ·  12 小时前  
橙子聊房子  ·  疯狂的股市VS回暖的楼市,你该怎么选 ·  昨天  
橙子聊房子  ·  疯狂的股市VS回暖的楼市,你该怎么选 ·  昨天  
北大纵横  ·  比贾跃亭还会忽悠的车企,IPO了 ·  3 天前  
北大纵横  ·  比贾跃亭还会忽悠的车企,IPO了 ·  3 天前  
老张投资笔记  ·  亏钱不是什么坏事,就怕一开始就赚钱 ·  3 天前  
老张投资笔记  ·  亏钱不是什么坏事,就怕一开始就赚钱 ·  3 天前  
洪灝的宏观策略  ·  洪灝:决战十万亿(多图) ·  5 天前  
51好读  ›  专栏  ›  智慧产品圈

从功能到智能,带你一步跨进汽车语音2.0时代!| 智慧产品圈

智慧产品圈  · 公众号  ·  · 2017-05-26 06:38

正文


本文根据同行者科技联合创始人叶维先生“汽车语音助力车联网”的演讲内容整理,未经本人确认。

同行者科技是做汽车智能语音的,核心团队来自于腾讯,与做语音引擎的云知声建立了深度合作关系,为行业超过200家的品牌厂商服务,也与做传统车机的公司和主机厂等有深度的合作。在过去一年里,在后装市场的占有率总体达到了70%以上,其中在车机里面的占有率达到80%以上,后视镜占到60%以上。


01

大数据分析各类语音的使用率


从2015年11月份开始截止到目前大概积累了639万的用户,车主在车里面到底是怎么使用语音的?通过分析超过1亿条以上的用户语料,发现在车主使用场景里面,使用频率最高的是导航,也就是说通过语音的方式说我要去哪里、导航到哪儿,其次是听歌、娱乐这样的服务。除此之外还有系统指令,比如打开行车记录仪、wifi等系统性的操作。


▲ 图:用户在各个场景下使用语音指令的比例

再看具体交互的的内容,指令性的占到71%,把它当做陪你聊天的机器人在车里闲聊的场景占到18.4%,这也是非常高的比例,其他占到10%左右。


▲ 图:用户在车里进行语音交互的具体内容占比

另外,在导航场景下,用户说的最多的三个字是“我要去”,这是最通俗、最容易理解的一句话,也是用户说得最多的。

在音乐场景下,说得最多的是播放,其他还有如来一首、我想听等。这时候可以根据的用户的听歌喜好判断出车主是什么样的人,处于什么样的年龄段。

系统场景下用户最常说的两个字是打开,比如打开行车记录仪、打开播放器、打开ADAS等。此外,用户还经常让机器给他讲笑话,还会问天气、查询股票等。


02

从功能时代跨入智能时代


通过语音来划分,可以分为两个时代:汽车1.0时代和汽车2.0时代。1.0时代更多是功能时代,2.0时代更多是智能时代。

在1.0时代我们常常会说这些指令,“拥堵、多久到、车头朝上、高速优先”等等,这些指令我们认为远远不够,所以2.0时代,我们跟导航的交互变成这样。例如我要去世界之窗,顺便加个油,从这句话里有两个意图,一是去一个目的地,二是要沿途寻找一个方便的加油站。因此,在语义分析时必须拆借,变成两个目的地,一个是目的地,一个是途经地,然后给到地图,地图才能做精准路线规划。


类似的场景如我要去广州小蛮腰,途中去深圳机场接个人,这也是一个途经点。还有下班回家的时候,一般开车回家不需要导航,我们需要导航是看那条路堵不堵,因此当用户没有打开导航的时候,是否能主动告诉用户回家的路上有无拥堵。另外比如我要去海岸城附近的咖啡馆这样的说法,他要找的是海岸城的咖啡馆而不是海岸城,所以语义的分解才是未来的重中之重。


在2.0时代我们做了多引擎,像云知声、科大讯飞、普强信息、百度、搜狗、乐视,他们都在做语音识别的功能,我们把这些能力接入我们的产品里来,让识别能力提升,此外我们还接入了百度大脑,例如开车的时候你可以问它,飞流直下三千尺,下面一句话是什么?他会告诉你下一句是什么,谁写的,是什么诗。你问宝马汽车的信息,他会告诉你。你问玫瑰花什么时候开花,他会告诉你。这会让整个场景变得更智能化。

音频娱乐服务方面,在汽车语音1.0时代,我们更多的是看到类似“来一首歌、我想听、增大音量、继续播放”等等这些指令,汽车语音2.0时代,在堵车的时候,我们会考虑主动推送一些好玩的歌曲或者音频服务。另外推送方式也会变化,例如讲笑话,以前是一段文字,用TTS的方式把它读出来,现在的做法是直接接入喜马拉雅、考拉、段子来了等这些平台,将他们的节目呈现给用户。


另外,可以根据用户的行为习惯和所处的位置,我们会为他做精准的智能化推荐,例如开长途的时候,往往是2-3小时,为其推荐一段逻辑思维去补充精神食粮,或是播放一段评书。还可以做到在早上上班的热车时间,做一些头条新闻的介绍、天气的播报、前方路况的播报,这也是一个主动的去给用户提供服务的做法。


▲ 图:自动推送人性化的内容

在汽车语音2.0时代,我们把QQ音乐、各种网络电台、路况、天气、违章播报整合到一起,聚合了全网最优质、最全的音频娱乐服务。为什么这样的音频娱乐服务要跟语音有关系呢?举个简单的例子,比如你说我要听杰伦的歌,我们会判断为你要听周杰伦的歌,你说要听Hebe的歌,我们也会纠正过来去寻找田馥甄的歌。你说我要听《白色毛衣》,可能说错了,是《黑色毛衣》,即使你说错了,我们也会呈现出正确的,这是音频服务和语音服务深度打通的原因。


▲ 图:同行者整合的音频服务

再从社交上看,我们推出了同行者车载微信,完全可以做到不需要用手和眼睛看,直接用耳朵、声音就可以操作微信。整个界面和车机是深度匹配和融合的,我们可以直接回复微信、发表情,比如我说一个什么表情,就可以发。如果对方发定位过来,这时候你只需要说“导航过去”,这时候就可以导航。以往收到定位要点开这个人的消息,然后选择位置消息,然后再选择地图软件,再跳转到地图进行导航,现在可以直接导航过去。如果这个人消息很多,你也通过语音来屏蔽。


▲ 图:同行者车载微信


03

差异化、个性化的服务


在语音1.0时代,声音非常单一,2.0时代具有个性化、差异化,我们首创杨贵妃版、臣妾体、宫廷版,你喊小红,它会说臣妾在,皇上有什么需要?你说要什么歌,它就说臣妾为您奏乐。这样人开车的体验变得很有趣。还有林志玲、小萝莉等声音,还可以为客户、车主定制声音,比如家里宝宝的声音。

现在车内的语音可跨应用、跨界面操作。例如在导航过程中(音乐在后台播放时)说下一首、暂停、增大音量等,在任何界面下说关闭屏幕。另外可以随意修改唤醒词,如果你想给机器取一个名字叫杨贵妃或者取一个名字叫范冰冰,都是可以的。

语音界面方面我们做了很多不一样的UI,以前每个人的设备的语音界面都是一样的,因为我们是B2B2C的市场,所以必须考虑到B端的诉求,我们在给客户服务的时候,会有很多长得不一样的界面,比如搭配钢铁侠等创造出很有科技感的风格。

同时我们正在打造车联网的平台,试图解决如下几个问题,一是行车过程中的基础需求,蓝牙、社交、音频服务。二是生活需求,比如衣食住行,娱乐等等。三是车的需求,比如加油、保养、停车、维修等等。四是汽车故障的播报、异常操作的报警等等,还有车辆信息的收集以及车主信息的收集等,这一系列都是未来车联网不可或缺的部分。这是我们定义汽车智能语音2.0时代。



《中国智慧家庭产业创新成长启示录》现已公开预售,点击“阅读原文”获取订购入口,也可关注“智慧产品圈”微信公众号-->菜单栏-->新书预售-->新书试读,免费阅览部分精彩内容哦。



*由“智慧产品圈”原创,如需转载,请登录新榜网站版权频道(http://cc.newrank.cn)