专栏名称: 雷峰网
中国智能硬件第一媒体
51好读  ›  专栏  ›  雷峰网

海知智能谢殿侠:从CES到AWE,未来智能家居的语音控制/交互趋势(附PPT+视频) | 硬创公开课

雷峰网  · 公众号  · 科技媒体  · 2017-03-18 18:49

正文

在今年的AWE 2017中国家电及消费电子博览会上,雷锋网观察到,除了传统的家电厂商循规蹈矩的参展之外,各家家电巨头以及新兴厂商都使出了浑身解数,让自己的家电产品向「智能家居」方向靠拢。

在这些参展的「智能家居」企业中,绝大多数在做智能家居产品时,大多数都放弃了几年前「用手机APP控制家电」的智能家居概念,集体转向了「人工智能」概念的路子。其中人工智能在智能家居的运用中,语音控制和交互成为了智能家居的主要控制方式。其中,不乏有一些家电厂商推出了作为中枢控制的语音盒、机器人等产品,以追赶亚马逊Echo的脚步。

从目前的趋势来看,随着人工智能的快速发展,未来语音交互将成为智能家居产品必不可少的一种操作方式,那么未来语音交互会发展到什么状态?为什么语音交互将成为智能家居产品的标配?在发展过程中中国的市场将会有哪些机遇和挑战?

本期的硬创公开课,雷锋网请来了海知智能CEO谢殿侠来跟我们聊一聊未来智能家居的语音控制/交互的趋势。

嘉宾简介

谢殿侠:海知智能 CEO,毕业于北京大学,从事过文字处理、知识管理等工作;创办海知智能,打造个性化聊天机器人开放技术服务平台,为智能硬件、智能机器人以及企业智能化提供语义理解 API,即基于自然语言理解和知识图谱的技术接口,使得「人人会做机器人」,最终可以「人人能有机器人」。

公开课视频:

以下是经雷锋网精编的谢殿侠演讲实录,关注雷锋网旗下微信公众号「新智造」,回复「PPT」可获取嘉宾完整PPT。

2017美国CES和中国 AWE 智能家居产品看点

2017年是一个非常有意思的一年,从年初的拉斯维加斯CES展到刚刚结束的中国家电展上,我们都可以看到一个非常有意思的现象:大大小小的家电厂商都在拥抱智能,或者说,都在拥抱语音交互,一些传统的智能硬件也在往新型的智能交互方式跃迁,我们来看一些具体的情况。

图中都是一些非常新型的智能设备,比如左上角这个智能灯,你可以用语音交互的方式用它来控制家里的智能设备,下面是一个智能语音的闹钟,没有了传统设备那么多的按键,而是使用语音交互的方式来操控。

在这些设备中,目前最大的赢家是亚马逊的Alexa,虽然他们没有来参加这次CES展会, 但是目前国外有很多的设备都已经接入了Alexa,包括上面的所有的设备。

虽然Alexa没有参展,但是我们中国自己制造的智能音箱参展了,就是图中这款联想智能音箱,这款面向北美产品目前也接入了Alexa,可以像Echo一样接入一些智能产品,也获得了一些相应的资源。

图中这个智能厨房,包括冰箱、抽油烟机等等,这些所有的设备都具备了语音交互的能力,当然背后的主角仍然是Alexa。

我们把目光移回中国上海,刚刚过去的智能家居展也展出了一些具有黑科技的产品,比如带语音交互的摄像头、桌面机器人、智能台灯等一些常用的智能设备,还有别具中国特色的智能后视镜,这个后视镜的主要交互方式也是语音。传统家电厂商海尔已经包了整个N1场馆,在里面展出了一些海尔的智能家居的产品,这些产品体现出海尔在家居方面的智能化战略发展方向。

语音控制、语音交互和语音输入法

假设我们从五年后回头看今天,究竟什么样的产品在语音交互上,能让传统的家电设备变成真正的智能家居,真正的走入智慧家庭?

其实用语音控制设备这个事情很多年前已经玩过了,比如最早前还没有Siri的iPhone就可以用语音来控制,用户可以对它说一些简单的命令词,让它来执行一些任务,但是它能执行的任务非常有限,本质上只能称之为「语音控制」,而不是「语音交互」。

所以说语音控制对语音交互来讲是一个非常非常初级的状态,目前很多的智能设备都具备了语音交互的能力和联网的能力,但是从很大程度上来说,它只是一种语音输入法,其原理是将声音变成文本,然后用文本来对设备进行控制。

此前业内做过这方面的人应该知道,带有语音控制的产品做出来之后看起来很好,虽然这些产品都具备了语音控制的能力,可以用语音控制各种家用电器,用「命令词」来替代以前的遥控器,从而做智能化的尝试。但是数据是会说话的,这些产品普遍卖得都不是很理想。原因是虽然到今天语音识别已经有了很大的突破,但是仍然达不到百分之百的准确。

和传统的遥控器相比,用户用传统的按遥控器控制家电,可能按十次会有九次对,一次手滑按错了,但是用语音控制遥控器,十次可能只有八次是对的,所以语音控制并没有比传统遥控器更加的快捷、高效,这就是目前的具体的一个现状。我作为一个语义理解公司的创始人,目前在控制空调的时候,都是更喜欢使用按键遥控器。在这种情况下,很多语音控制的的功能就会变成一个摆设,在最初的时候大家可能会尝鲜玩儿一下,但是过一段时间之后就会放弃了。

另外,我们看下传统意义上的智能家庭的智能设备的遥控器,比如之前很火的nest,它采用了触摸屏+旋钮的方式来实现对家庭智能设备的控制。用户既可以手动用它来控制家电,另外它内部带有大数据,可以用来学习,也可以自动地完成一些自动化的控制,比如你什么时候在家、什么时候出门,当你出门自动帮你关掉某些电气设备等等。在这种情况下,它仍然要比语音控制交互更加直接,更加准确。但是如果你问它今天出门要带伞吗?那么强大的nest就傻了。

智能家居其实是智能机器人

关于真正的产品智能化,这里有三个关键词,就是你要做的到底是个「道具」还是个「工具」还是个「玩具」?

当我们把语音控制的功能,作为替代遥控器功能的控制器来做,那么很大程度上它的意义就是个道具或是个玩具。因为它不能带来更加直接更加有效,或者更多功能上的附加值,也许就是大家新鲜一下玩一玩就完了。那么怎么才能让语音控制成为一个工具,让大家用了之后离不开、有粘性呢?

那我们从大的方向来看一个变迁。

PC到机器人

键盘鼠标是PC时代的产物,众所周知,当初我们学键盘的时候需要很高的学习成本,而到了触屏机时代,也就是移动互联网时代,我们学习智能手机的成本就会降低很多。由此看来,设备的提升和相应的使用学习是应该趋于越来越简单易用的。

从PC时代到智能手机时代,我们用了差不多二十年,而从智能手机触摸屏时代到现在的Echo之类的语音交互设备,我们用了差不多十年。

Echo这个产品在北美的市场非常的成功,而在中国,类似的设备却还在探索的过程当中。这里面非常非常重要的一点,就是我们现在的产品更多是语音控制为主。而Echo更多意义上来讲它是一个智能的机器人。

之前我们所说的机器人,更多是那种电影里面有胳膊有腿的人形机器,但实际上,目前很多「机器人」产品能动、能跳舞,那是因为这些机器人是通过程序控制的,它并不能听懂你的话,只是一个玩具而已。真正能被称作机器人的应该是它具有区别于动物或植物的本质特征——能听得懂人话,并且能够以自然语言跟人交流。另外,它有信息、有知识、有服务,他能够听懂人的话,而且能满足人的要求。这些才是机器能被称作「人」的本质的特征。那么Echo和其背后的Alexa就具备了这些特点,这也是我们称其为机器人的原因。

智能音箱和音箱智能

左边的这款产品是罗技的智能音箱,右边的是Echo,以这两个为对比,普通的「智能音箱」需要连接手机使用,手机播放的音乐可以从智能音箱中放出来。虽然Echo也可以连接手机,但多数时候它并不需要手机去控制,你只要在连接WiFi的情况下跟它说话,它就能去满足一些要求,比如说播放音乐、帮你打车、查询天气、听书等功能。它能听懂用户的话,可以提供用户所需要的各种各样的服务,在这种情况下它俨然成为了家庭的一个成员。在初期的时候,它的能力只覆盖了二十多个领域,而现在它开放了平台之后已经覆盖了超过1万个领域。也许以后就会出现像App Store一样的各种应用库,在里面有很多个插件,来满足人们各种各样的需求。

「人机交互」到「人“人”交互」

下面我们来看一看真正的语音交互和传统的语音控制在设计上有什么区别。

以前我们是把机器人当作一种工具,叫做人机交互,现在我们把机器人当作人来看,就成了人“人”交互。

举一个具体场景的事例。

普通的语音控制情况下,早上闹钟响了之后我们会说:「关闭闹钟吧」,「把闹钟关掉」等等,「关闭」这个关键词总是在用,但是在日常生活中,人说话的语境是不一样的,有的时候我们会说「我想多睡一会儿」、「别吵了」等等,这样机器缺少了关键词就很难理解了。当然这个也可以设置多种多样的关键词来解决,但终究是有限的,因为人们的说法会多种多样。真正的智能设备应该像有一个人在那里一样,它能够听懂你的意思、知道你的意图。

一个真正的智能家居或智慧家庭里的一个场景应该是,设备上没有限定,只要有麦克风能把你的声音进行收取和分析即可,它的形态可以是闹钟、可以是冰箱,也可以是其他的东西,这些东西能使用云端的大脑来跟你交流。

拿天气预报来举例,比如说以前的语音控制之类的软件,会抓住你的关键词,来向你播报天气,其出现的结果就会像第一张图一样,出现日期、地点、天气等所有的结果。但是实际生活中我们所说的话是非常口语化的,一句话有多种多样的说法,一个真正的智能设备应该是能够听懂人各种各样的说法,并给出既定答案。比如问「今天北京有雾霾吗?」,他就会告诉你北京的雾霾指数有多少。你问「今天风大吗?」,它只会跟你说外面风力的情况,而不是把所有的数据都报出来。你问「今天出门需要带伞吗?」,它也能够听得懂这是一句问天气的话,而不是问其他的。就好像你有一个气象管家一样。

再拿音乐来举例,虽然很多设备可以实现语音控制的方式来搜一首歌,但实际情况是用语音搜索,还不如打开一个app来得快捷。而且很多音乐APP的推荐也很多、很准。在这种情况下,用户更喜欢用手机来搜索,然后用手机连着音响来听。

而在理想的语音交互层面来说,不管我的音箱、电视甚至冰箱、空调,都可以为我们搜索歌曲,不管我走到哪个房间,只要我想听歌张嘴说话就可以。这里面需要一个关键点,就是说语音交互的方式,能不能比传统的方式,更便捷更好,让人放弃传统的方式去搜索。

如果以后能够发展到每一个房间都有相应的智能设备,那么语音交互的方式应该是什么样呢?就如下图所示,光搜索还不够,比如跟机器说「我想听刘德华最火的歌」、「我今天累了,给我放一些舒缓的音乐」等等,机器都能够满足你的条件。只要有足够的曲库、所有的设备里面都能听懂你说的话并且还能给你结果,就达到了真正的语音交互的方式。除了音乐之外还有其他的场景,比如听书、厨房应用等等。

在这种情况下,冰箱不仅仅是冰箱,空调也不仅仅是空调。他们首先都是一个机器人。

当智能家居具备了语音交互的能力,而不仅仅是语音控制的能力之后。就意味着每一台家用电器都变成了机器人。这些机器人都能听懂你的话,并且具备一些相应的能力。拿冰箱为例,一旦打通了交互的能力就会有音乐的功能、菜谱的功能等等,如果你在使用中有什么问题也可以通过冰箱去连接相应的客服。这样一来,就把很多传统的业务的边界给打破了。

比如说,家用电器和音乐服务、电商服务等等这些服务相融合。另外一边,一些具备服务能力的人也多了一种可能性。他们可以利用这些设备进入更多的家庭。

比如说,有个朋友在北京某个饭店吃了一个某个法国大厨做的非常好吃的面包,当他回到家里之后,他就可以直接问烤箱,XXX厨师的XXX面包怎么做?除此之外,那个法国大厨的面包做法和配料需要付钱才能得到,智能设备也会打通一些支付服务,付几块钱,然后教你如何做这个面包。

这种方式的好处就是用户的使用成本降低了,比如说我在厨房做一件事物的时候,我只要去跟冰箱、烤箱等电器说说话就能把食物做出来,而不是坐到电脑面前或用手机APP去查询,在支付上非常的方便。这个就会改变过去APP、网页时代的整体的业务模式。

语音交互是智能家居标配

上面是通过一些具体的场景来描述语音交互为传统的家居家电产品带来的一些变化。其实语音交互未来会成为家电的标配是一种趋势。

从2017的CES展上我们就可以看到,的的确确有很多的最新的智能家居设备都打通了Alexa的功能/联网的功能,具备了机器人最基本的智能。当这些使用场景稳定了之后,这些智能设备就会变成一个家庭的新成员。家里面虽然智能设备不同,比如说,厨房有冰箱、微波炉,客厅有空调、电视、音箱,但其背后可能都是同一个机器人。而且不同的家庭成员之间有不同的机器人,每个人在使用机器人的时候可以把自己的机器人调用出来,并体现在不同的设备上。

这个场景的实现取决于三个条件。

第一是硬件成本的降低,比如说WiFi模块、各种声音处理的芯片等硬件模组成本的降低。随着市场的火热,现在已经降低了很多,再过个几年,没准儿这些硬件成本会降到几十块,到时候,几十块对于一台家用电器整体来说,将会是一个很低的成本占比。等硬件成本降低到一定程度,用户体验也达到一定的程度,达到一个临界点之后,那么这个领域就会被引爆了,规模越大,硬件成本降得越低,这是一个良性循环。

第二是内容资源和服务的丰富。当硬件具备了语音交互的支撑能力之后,技术提供商在内容资源和服务方面就可以发力了,比如去签一些内容版权等等。而内容提供商也可以把他们的内容打包成基本插件,来把这些内容变成机器人的基本能力。其实,这一块随着智能硬件接入的越来越多,也会给内容服务带来更多的流量。更多的流量会刺激更多的内容提供商,去接入这些服务。也会成为一个良性循环。

第三个是一个非常关键的点,就是需要语音识别非常的准,语义理解也非常的准。而在这一块,语音识别的速度发展得非常快,应该会在两三年内,甚至在今年,就达到非常非常高的水准,甚至会接近或达到人的水平。但是语义理解方面,会挑战得更大一些。

在限定的条件下,只能为我们的家庭用户,在厨房或客厅等场景中解决有限的部分问题,但是在上述三个条件边界明确的情况下,实际上现在产品是可以做的十分成熟的。所以,语音交互成为智能家居的标配是一种必然。

中国市场的机遇与挑战

接下来我们说说中国市场的情况。

市场刚刚觉醒

当硬件成本降低,语音语义技术的容错率达到人们可接受的范围之内之后。那么,智能家居这个市场就偏向成熟了。想达到这个程度,对于中国的市场来讲不是今年就是明年,而对于北美市场来说,一般认为是2016年,因为Alexa的的确确已经卖了1000万台,而且有很多家庭都已经形成了使用习惯,将其变成了用户家里面一个不可缺少的部分。

之前在这一方面,中国市场坐了很长时间的冷板凳,所以大家觉悟都比较慢,甚至在2014年和2015年,这时候人们还对这个有争议,甚至怀疑Echo数据有水分,现在已经没有这个争议了,而且各厂家都开始朝这个方向去发展,市场已经开始觉醒、开始尝试。

芯片的成熟

未来芯片和板卡都会相应地成熟起来,成本也会降低,届时的市场就会崛起。但这一块还有一个巨大挑战,比如说我们要把产品的出货订到具体的几个月能不能搞得定?目前还是不能保证的,供应链良莠不齐,真正具备承受能力的、成本可控的解决方案商还是有限的。 但是在这方面对于中国的智能制造的能力来讲,还是没什么问题的。我们希望,会有更多的原来做手机做平板等智能芯片板卡的供应商加入到这个里面来。

内容生态链尚需完善

相对于国内来讲,内容生态链方面在国外确实做得相对完善一些。而国内也在逐步的完善,近两年有声资源版权意识都有所增加。但是我们目前国内的情况也有一个问题,就是资源过于集中了,并且都集中到了几家巨头手上,然后他们对目前智能家居等新兴产业这块支持力度不够,内容的成本也比较高。这些内容版权商如何开放、如何降低成本、如何能让更多的智能设备来接入,这也是一个挑战。

另外的挑战基本就是语音识别语音理解的成熟这一块,国内也有在努力,有很多企业在做,但是这样的企业还需要更多。

总的来说,市场非常的大,未来就在眼前,前途是光明的,道路是坎坷的。还有许多具体的问题要克服,只有把这些问题都克服了,才能够打造一款大家都喜欢的产品、一款有粘性的产品,而不只是一个概念、一个Demo、一个玩几天就不玩了的玩具。



“喜欢就赶紧关注我们”

新智造,雷锋网旗下栏目

关注智能时代的创新与创造

应用化 | 智能化 | 网联化 | 产业化

长按下图二维码并识别关注

新智造(ID:AIRobotics)

更多精彩内容,点击“阅读原文”