专栏名称: 两个质子
我们是谁?我们从哪里来?我们到哪里去?一群为科学着迷的普通人,一群为生活着迷的科学家。我们就是两个质子。
目录
相关文章推荐
果壳  ·  睡 它!!!巨 巨 巨 巨 爽 !!! ·  2 天前  
果壳  ·  Gemini 2.0 ... ·  5 天前  
51好读  ›  专栏  ›  两个质子

亚马逊Echo两周年:也许它才是智能家庭生活的未来

两个质子  · 公众号  · 科学  · 2017-01-05 16:35

正文

2014年11月6日,亚马逊在官网低调地宣布了一款名为Amazon Echo(下文或简称Echo)的家庭智能音箱;没有发布会,更没有亚马逊CEO杰夫·贝索斯的站台,Echo的问世远远不如Fire Phone发布之时那么风光。

▲贝索斯为Fire Phone站台

整整两年过去了,Fire Phone早已死去,而Echo和它内置的智能语音助手Alexa却越来越受欢迎。2015年,Amazon Echo一举占据整个音箱市场销量的25%,比2014年增加了1200%。

图自:businessinsider

而据研究机构CIRP的统计,截至2016年4月,Amazon Echo的销量已经突破 300万台。

失败是成功之母

关于Echo研发背后的故事,有这样一个桥段:

一开始固执的贝索斯想把它命名为 Amazon Flash,但后来在研发团队的坚持之下,贝索斯妥协了,Flash最终变成了Echo。

Echo的研发起自于2011年,当时它是亚马逊硬件研发中心Lab126的D项目。不过在Echo发布之前,亚马逊最重要的产品却是 B项目Fire Phone。

Lab126研发出的产品

2014年7月,当Echo还正处于开发冲刺阶段时,Fire Phone在万众瞩目中出现在亚马逊的发布会上,一时间风头无两。颇具戏剧性的是,不久之后Fire Phone就宣告失败了。

在此之后,亚马逊才将所有的重心转移到Alexa和Echo上来。

图自:YouTube

据负责Alexa机器学习的首席科学家Rohit Prasad说,Alexa的灵感来源是《星际迷航》中的计算机;受前者启发,亚马逊想创造一种全新的计算机交互体验:

脱离于屏幕之外,更接近于人类之间的正常语音交流。

于是,在Fire Phone失败之后,Echo开始承载起亚马逊下一个野心勃勃的梦想。

正如后来我们所看到的那样,Echo的最终形态是一个可以进行语音输入和语音输出的智能音箱,它根本没有配备显示屏。这就意味着,Echo所有的工作都要通过语音交互来实现。

如今,通过语音交互,Echo已经能够实现包括播放音乐、设定闹铃、查询信息、Uber打车、一键下单、在线订购披萨、控制开关等多方面的功能。

语音识别

今年Code大会上,在与Recode联合创始人莫森博格的一场深度对话中,贝索斯提到亚马逊将大力发展人工智能业务;而目前已经内置在Echo智能音箱中的Alexa语音助手,很有可能将会成为亚马逊的第四项支柱业务。

图自:recode

其实亚马逊智能语音助手最初的名字是Echo,后来在2015年8 月,为了与音箱本身相区分,Echo更名为Alexa,与亚马逊旗下的一个网站分析工具同名。

由于语音是Alexa唯一的交互方式,所以对于语音识别、语义分析等方面的技术要求极为严格。为此,亚马逊先是从老牌语音识别公司Nuance挖来了一大批人才,后来又收购了两家致力于语音技术的创业公司Yap和Evi。

programmableweb

截至今年6月,亚马逊从事Echo项目的团队成员超过1000人。

在Echo的研发过程中,有一个较为棘手的问题是如何在家庭场景中实现让Echo进行语音识别。这里所说的语音识别不是简单地知道人们在说什么,而是在声音嘈杂的家庭场景下,如何分辨出人们是否在对Echo讲话。

这听起来似乎很简单,但Echo团队却调用了亚马逊积累已久的机器学习技术,专门写出了一个算法软件,才最终解决这个问题。

问题解决之后,Echo的语音识别功能可谓强悍。以下面这个场景为例:

在一个播放着摇滚音乐(或者有人在谈话)的房间里,用户如果说出了Alexa这个词汇,即使很吵闹,即使人耳也听不清楚,Echo会通过算法,自动对房间中的诸多杂音进行识别和屏蔽,以实现对Alexa这个唤醒词汇的敏感反应。

智能音乐服务

作为一款音箱,Echo首先要做到的是播放音乐。

一开始,Echo音箱只能支持亚马逊自己的曲库;但显然是不够的。后来,顺应用户的呼声,Echo又增加了对Pandora、Spotify等音乐提供商的支持。

Amazon Echo开始支持Spotify

除了对音乐内容的涵盖,亚马逊也针对Echo音箱探索出了一项全新的智能音乐服务。

2016年10月,亚马逊推出了一个包月价格为9.99美元的音乐服务 Amazon Music Unlimited,这项服务针对Prime会员的优惠价格是7.99美元。但是,针对Echo用户,这项服务不仅在价格上低至3.99美元,在功能上也与Alexa实现了完美结合,从而显得更加智能化。

Amazon Music Unlimited价格表

在订阅Amazon Music Unlimited音乐服务之后,Echo用户能够直接通过语音来选择音乐;但是,选择方式不仅仅是歌手名字、专辑名称、音乐风格那么简单。

通过Alexa智能助手,Echo能够对音乐的年代、音乐歌词片段、音乐表达的情绪进行识别。一个典型的例子是,如果用户对Echo说播放“80年代之后U2乐队的音乐”,Echo就能够按照要求自动响应。而且用的人越多,Echo就会越智能。

Echo的智能音乐服务

除了音乐,亚马逊还在Echo上整合了自家另外一项基于音频的服务,也就是有声读物Audible;通过Echo,用户就可以听书了。

智能家居和第三方开发者

在Echo的改进过程中,亚马逊一直非常注意聆听用户的声音。在发售初期,亚马逊只邀请了一小批Prime会员来试用Echo,当然这批用户需要给出反馈意见。后来直到2015年7月,Echo才正式开放购买。

事实证明,这种方式非常有效,而且有了意想不到的收获。

本来,在Echo团队最初的产品规划中,他们并没有打算让Alexa来控制家庭中的灯、风扇等电器设备;在Echo最初发布时的介绍视频中,这项功能根本没有被提及。

但是通过早期用户的反馈,Echo团队发现消费者对这项功能很感兴趣,而且它正好契合了智能家居的发展趋势。

于是,2015年6月,亚马逊推出了语音服务Alexa的开发包,正式开放Echo。设备制造商可以利用亚马逊提供的Alexa API,让自己生产的设备能够支持Alexa。

同时,亚马逊在自家电商网站上开辟出一个名为Alexa智能家居的板块,所包含的设备包括灯泡、电风扇、空调、摄像头等。

可以支持Alexa的家庭电子设备

如今,Alexa已经初步成为一个可以控制其他家庭设备的交互中枢。

除了智能家居,亚马逊还为许多第三方开发者提供了开发工具,以方便它们将设备和服务整合到Alexa的人工智能技术中。

Alexa API

不过,这些第三方开发者还需要解决的问题是,如何让它们的服务完全通过语音交互的方式实现,毕竟现在的主流交互方式依然是GUI(图形交互界面)。

虽然如此,许多开发者还是看到了Echo在交互方式上的创新之处,并纷纷参与其中,其中一个典型的例子是 Uber。

今年2月,Echo增添了一项新功能;用户可以直接通过语音来让Alexa叫一辆Uber汽车,整个过程中用户完全无需掏出手机。当然,要激活Uber功能,用户还需要提前设置。

图自:uber

有数据显示,Alexa智能助手所支持的第三方服务数量已经从2015年9月的区区14个增加到了2016年5月的950个。

Amazon’s Choice

2016年3月,在Echo音箱的基础上,亚马逊又推出了Tap 和 Dot两款内置Alexa的硬件;前者更像是Echo的廉价版,而Dot则是将其他扬声器智能化的产品。

如此一来,亚马逊智能音箱的产品线得到了大大丰富。

Amazon Echo Family

虽然如此,靠售卖这些硬件来赚钱并不是亚马逊的主要目标。正如Kindle的任务是卖电子书那样,Echo的长远任务同样也是让用户在亚马逊上买买买,而且不仅仅是音乐服务和Audible。

这里其实说的就是Alexa的语音下单功能。关于这个功能,一个典型的使用场景是:

如果用户已经在亚马逊网站上买过东西,那么他们可以很轻松地通过Echo来下单购买已购列表中的商品;这几乎一种天衣无缝的体验。

通过Alexa来下单

但如果是一件新的商品,通过Alexa下单就变得非常复杂了。用户肯定不愿意花太长时间听Alexa一个个报出可以购买的商品;而且在一些情况下,用户甚至不知道他们要买的东西的名字,

这实际上就是Alexa的短板所在。它还并不能充分理解和满足用户的购物需求,尤其是当用户需要在多项商品中进行挑选的时候。

按照Echo&Alexa产品总监Reid的说法:

在语音交互之下,用户只需要一到两个选项。人们并没有足够的耐心听Alexa报出三个或三个以上的产品。

Echo团队给出的解决方案是,对于那些可以被归类的同质化产品(比如说电池),亚马逊通过算法直接挑出其中的一个提供给用户,并命名之为 Amazon’s Choice。

Amazon’s Choice

不过,如果是某些严重依赖个人主观审美喜好的商品(比如说衣服),Alexa还是很难应付。

目前亚马逊仍在不断改进Alexa的购物体验。按照Prasad的说法:

在印度,人们总是去同一个商店找同一个售货员来买东西,他们之间已经形成了一种信任关系。我们也想通过我们的语音购物助手与用户建立这种关系。这里所涉及到的不仅仅是技术问题。

你投谁一票?

为了让语音交互显得更加自然,亚马逊在发布Alexa和Echo之前,已经对Alexa的发音进行了多番调教,使其听起来更接近于人声。

但在发音之外,Alexa还要面临更大的挑战。许多用户把Alexa当成一个真实的人,并问它一些超出团队预期之外的问题。

比如说,有超过13000个用户向Alexa提出关于美国大选的问题:

你投谁一票?

Alexa的回答是:

我的云服务里没有投票站,只有0和1。

为了让Alexa更加擅长语音交流,亚马逊开始寻求大学生的帮助。今年9月,亚马逊发布了一个名为Alexa Prize的年度竞赛奖项,鼓励美国的大学生们来开发能够针对特定话题聊天超过20分钟的机器人,获胜者将获得亚马逊提供的250万美元奖金。

Amazon Prize

亚马逊之所以这么做,也许是因为感受到了来自于竞争对手Google Home的挑战。

在2016年的 Google I/O大会上,Google宣布推出基于人工智能的家庭智能音箱Google Home;很明显,Google Home就是为了与Amazon Echo竞争而来。

更重要的是,Google Home内置的人工智能语音助手Google Assistant,在会话聊天和信息检索方面的能力不可小觑。

Google Home

而且有消息称,苹果似乎也在计划推出一款与Echo类似的产品;而微软、三星等其他公司似乎也想要参与到这场语音交互的大战中来。

Google Home的入局虽然对Amazon Echo来说是一个重大挑战,但这也反过来也能够证明,在家庭智能音箱领域,亚马逊已经成为一个事实上的引领者。

这种以家庭为使用场景、以人工智能为技术支撑、以语音为交互方式的智能音箱,很有可能成为继智能手机之后的另一款热门的消费级科技产品。

在谈到竞争对手和Echo的未来时,亚马逊强调说:

我们并不是非常在乎其他公司的动向,我们有自己的路线图;未来Echo将会为用户提供更多的功能。我们坚信有90%的可能性解决技术难题,并将最终创造一个全新的产品种类。