专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
51好读  ›  专栏  ›  DeepTech深科技

谁将是AI时代的中国“苹果”?BAT、科大讯飞还是中移动|深度观点

DeepTech深科技  · 公众号  · 科技媒体  · 2017-01-24 22:03

正文



还有三天就要迎来中国传统的春节,很多人都已经在回家的路上,但对中国消费科技领域的大佬们来说,这个春节也许会成为一个焦虑的假期,甚至夜不能寐了。

 

随着亚马逊Echo及AI操作系统Alexa在海外市场的高歌猛进,AI颠覆中国消费市场的时间点看似已十分接近,而且可能就在今年。




亚马逊 Alexa 在2017年CES上引人注目的表现让这个话题不再是秘密,几乎业界所有人都已经看到AI爆发到来的可能,只是没有人确切知道是什么时候,由谁来完成。

 

这个时刻,很像当年苹果已经将iPod和iTunes推出了相当时间,而真正的杀手级产品iPhone即将推出的时刻。当年的苹果就是如今的亚马逊,没人知道亚马逊的下一步是什么,但可以确定的是,这一步如果成功,将不亚于当年的iPhone,人机交互方式将彻底颠覆,一如当年的iPhone触屏,AI将大步进入消费级市场。

 

但无论如何,中国市场量级之庞大,而且相对的滞后和绝缘,为本地巨头们留出了时间窗口。这意味着,亚马逊在中国大陆的替代者之争夺将空前激烈。没有谁会对如此明显的趋势掉以轻心,那除了紧迫感还剩下什么?

 

然而,趋势毕竟就是趋势,只是一种预期。而一款消费级产品是否成功,对消费者来说,最重要的就是产品用起来爽不爽,以及整个的交互体验是否令人愉悦。历史上,比如从DOS到Windows,这种从命令代码到图形化操作系统的升级就是体验的一次飞跃;比如从按键到触屏,向人类自然操作方式更近了一步,也是一个道理,都是由技术进步所推动的。

 


众所周知,AI这项技术已经面世很久了,但因为交互体验的“甜点”(Sweet Spot)一直没有到来,所以只是一项远离消费市场的实验室技术。用亚马逊的例子来解读,Alexa之所以受到欢迎,就是因为达及了“甜点”,使用户的交互体验上到了一个全新的台阶。在此基础上,交互效率也实现了大幅提升,完全通过自然的对话从Echo获得服务,远比在手机上点按方便得多——五步左右的操作可能只需简化到一到两个步骤就能实现。

 

所以,目前的情况就是:一场由AI导致的新的交互革命已经开始,而且这场革命将席卷一切,将来所有的机器、智能硬件都会被这场革命包含在内。所有的设备都将“听得到”你在说什么,“听得懂”你在说什么,然后去执行相应任务。

 

现在再回头看,当年智能手机时代突出重围的为什么是苹果,而不是摩托罗拉、诺基亚、微软?就是因为苹果领导了一场全新的交互体验革命,这也是为什么很多研究者说苹果不是一家硬件公司,而是一家UE(用户体验)公司。

 

无疑,亚马逊已经在AI时代拔得头筹,其成功首先是技术上的。据加州大学洛杉矶分校语音识别专家Abeer Alwan向DT君介绍,通常情况下,用于训练和测试语音识别系统的标准数据库并不包含家庭环境下的音频,也不包括类似于Echo通过使用麦克风阵列来获取特定方向的语音。


亚马逊Echo的麦克风阵列

 

在硬件设备上使用麦克风阵列已经有很长的历史了,但还未有一款只能语音产品能达到目前亚马逊的部署规模。一般来说,更多关于特定场景或语音类型的数据能转化为更好的性能。


比如,在多人语音识别问题上,Alexa创始团队成员 Nikko Strom 已经带领团队取得了不小的进展:通过用户提供的数据,帮助亚马逊在鸡尾酒会问题(cocktail party problem)上有所突破。这是计算机语音识别领域的一个难题。当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数超过一人时,语音识别率就会大打折扣。

 

Nikko Strom希望,通过Echo大规模部署所获得的数据最终能够帮助Alexa进一步升级,从而能够同时准确识别多人说话的声音。但他并没有提到,当这个问题解决的时候Alexa能做什么,但是这至少会使Echo在交互时更加自然、更进一步融入到对话场景中去。

 

“鸡尾酒会问题”的解决方案之一:盲信号分离

 

除了技术上的优势,Alexa收集的数据也将帮助亚马逊打败Echo的竞争对手——Google Home。谷歌的确可以将网络搜索和语音搜索领域多年的积淀,以及大量资金投入到人工智能领域,但是谷歌之前的产品和业务都没有收集类似于用户在家中呼叫语音设备的数据库。所以,亚马逊在真实使用场景下的数据收集方面,又抢占了先机。

 

亚马逊不仅通过Echo软硬一体的设计在技术上击中了用户交互体验的“甜点”,同时更在生态上做了完美的布局,它后端整合内容及服务,前端整合触及用户的各类终端设备,用户数和服务数都在快速生长,在帮越来越多用户解决越来越大问题的同时,帮助亚马逊将进入壁垒快速砌高。

 

Amazon Echo和Google Home

 

 

BAT+中移动,AI时代其各自优势在哪?

 

现在已经进入人工智能时代,当我们看到亚马逊Echo在重演当年iPhone大戏的同时,再看看中国,全球半壁互联网江山都在这里,谁最有机会突出重围?

 

从目前市场的布局来看,BAT(百度、阿里、腾讯)、科大讯飞及中国移动都做了很多准备,加上本身的实力,具备一定先发的优势。

 

目前看来,在AI消费市场取得成功,至少需要满足以下四个条件:

 

1、很强的硬件能力。AI是大脑,硬件是五官,首先要保证机器“听得见、听得清、看得见、能说会道,有视觉呈现和表达,甚至有感知”。这就要求设备有耳朵(麦克风)、嘴巴(扬声器)、眼睛(摄像头)、表情反馈(屏幕显示),这些类似人类五官的功能,来支持自然的交互方式。

 

要在人机交互方面达到“甜点”,需要大脑和五官的精细配合,硬件的工业设计、结构设计、电路设计以及许多算法都必须与AI算法密切配合,才能达到完美体验。在AI时代,软硬一体的设计已经成为必然趋势,所以当微软、谷歌、亚马逊这样的软件和互联网巨头纷纷开始推出硬件产品的时候,我们不再感觉到难以理解。

 

2、很强的AI能力基于AI的产品,不光要“听得见”,还要“听得懂”,能够“说得清楚”,能把信息表达清楚。语音识别、语义识别、深度学习,以及视觉智能等技术在未来的竞争中会成为核心竞争力。

 

3、内容和服务能力。AI可以提升用户交互的效率,提升用户获得内容和服务的效率,最终能够帮用户解决问题、满足用户需求。因此整合内容和服务的能力也十分重要,内容方面比如听音乐、广播、小说,看电影、电视剧等;而服务可能包括闹钟、提醒、日历、控制家里的IoT设备,以及穿透购物、订餐、叫车等O2O服务。

 

另外,AI能够提升服务效率,但难以替代真人,因此具备语音电话、视频通话、直播等通讯功能也十分重要。Echo目前没有显示屏,无法穿透如电影电视剧、视频通话、商品选购等服务,相信视觉辅助将成为必不可少的一环,因为很多内容和服务是基于视觉的。并且,当AI在达到高度成熟之前,视觉辅助的交互方式会显得更可靠。

 

4、迅速做大规模的能力。形成产品规模的速度决定了形成生态的速度,销售、渠道、资金方面的资源能力十分重要。Echo的销售量突破千万,与亚马逊自身电商平台优势是密不可分的。

 

只有上述四个条件集于一身,才可能出现未来的苹果。如果把BAT、科大讯飞和国内运营商放在一起作比较,就会看得比较清晰了:百度在AI方面做了大量投入,布局最为接近亚马逊的模式;阿里在内容及电商方面有很强的资源,具备迅速做大规模的能力;腾讯的优势在于很强的连接能力,能够快速整合第三方的服务,以及自身的优质内容资源,直达用户。百度已经把AI当做自己的未来,阿里腾讯也有自己的AI团队,但这三家在硬件上都还缺乏专业能力。

 

再看运营商,以中国移动为例来分析,其最大的优势就是迅速做大规模的能力,通过终端设备补贴、赠送的方式迅速把保有量做起来。当然,运营商现在在内容方面也有优势,比如中国移动的咪咕,在音乐、文学、游戏、视频等方面都已经具备了。AI方面本来不是运营商的传统强项,但中移动已经投资了国内著名语音技术领军企业科大讯飞。

 

在中国谈语音,不得不提及科大讯飞这家公司。虽然最近异常火热,但这家成立于1999年的公司多年来一直保持低调。其实,业内都知道,科大讯飞从一开始成立的时候就是做人工智能的,因为语音就是人工智能非常重要的一部分。可是如果在上世纪九十年代提人工智能这个概念,从商业上看恐怕不是一个好选择。不过现在,对讯飞来说,时机明显已经到来了。

 

DT君在采访科大讯飞轮值总裁、讯飞研究院院长胡郁时,他曾做出这样的评价:“判断一个公司是不是技术公司的标准是什么?是赚了很多钱?还是整天说自己在做技术?其实是看你的技术在这个行业的领先程度。我们中文语音是做得最好的,英文语音方面,我们连续11年都是全球英文语音合成大赛‘暴风雪竞赛’的冠军。”

 

从技术上看,科大讯飞已经做了长时间的积累,而且目的只有一个:让开发者和用户有最极致的体验。这一点与亚马逊在开发Echo时的战略无疑是非常一致的。

 

以下是对BAT+中移动在AI领域布局的具体盘点:

 

百度:

 

百度在两年半以前就开始布局AI相关产业,同时下了很大力气将现有搜索转化为服务,通过把语音转为文字,再更进一步转化为后端需求。如果一家搜索公司做类似的事情,还是有优势的。一个典型的例子就是从Google到Google Home,从回答问题,到对内容的理解、服务的覆盖能形成一个良性循环。

 

百度的优势目前看来在于两个方面:一是对用户需求的把握,二是理解用户表达需求的方式。

 

首先,从用户需求把握上说,很多需求是大家都有的,比如询问天气、交通状况,这类需求由于百度所从事的搜索行业及前期积累,会有比较充分的表达。从中国用户的整体需求看,百度已经建立了一个覆盖比较完整的系统。

 

第二点是对用户表达需求方式的把握。手机百度已经拥有一亿以上的日活,而且有很大比例的搜索是通过语音完成的。从这些语音搜索中,百度可以建立用户在语音交互时表达方式相关的数据库,属于比较独特资源。所以综合上述两点,百度在语音技术方面是有优势的。

 

百度在战略和思路上把人工智能放在了公司的首要地位,而且步伐比较明晰,短期产品、中期规划、长期愿景都已经铺开。百度相信人工智能被市场认可和接受只是时间问题。就像李彦宏自己说的:“我认为三年、五年,甚至十年、八年之后才会被市场所认可。”

 

最新一期《最强大脑》中登场的百度人工智能机器人

 

阿里巴巴:

 

在阿里的战略体系之中,云计算一直都是电商、物联网的核心驱动力。而阿里的人工智能也是放在阿里DT大商业体系内,配合云计算、大数据对阿里的电商物流乃至物联网体系进行全面强化。

 

2016年之前阿里在“人工智能”概念上的宣传要少于百度,更多是因为阿里的错位营销战略,把人工智能规划在“云服务”中。

 

阿里在人工智能方面起步较晚,在产品还未成熟之前,刻意避免过早被拿来和谷歌、Facebook、百度等厂商对比。不过随着阿里的AI技术发展,从2016年开始,已经明确地把部分产品和服务打上了人工智能的标签。直接与百度等公司展开正面交锋。

 

从阿里现有的人工智能产品来看,更多的是应用在电商业务中,比如通过人工智能技术来优化订单、解决复杂的服务场景、智能客服、违规图文识别、快递机器人等,更多的聚焦于电商的基础设施层面。虽然阿里具有强大的渠道和内容服务能力,也在诸如天猫魔盒等产品上搭载了阿里云智能语音交互技术,但毕竟还没有出现有能力抢占高频入口的产品。

 

提到阿里就不得不说一下京东,其与科大讯飞合作推出的京东叮咚(Ding Dong)智能音箱在生态拓展上已经有了很大进展。在2016年6月,叮咚开放平台的发布,已经吸引了像滴滴等服务商的接入。2016年10月,京东智能云语音服务开放平台上线,用户可通过叮咚呼叫第三方服务,随即美的、小天鹅等家电厂商接入,家庭入口布局也开始发力。大有利用AI时代赶超阿里的架势。

 

天猫魔盒

 

腾讯:

 

腾讯的核心业务主要是游戏和社交,而以目前情况来看,对人工智能相对涉及不多。有关的报道也屈指可数,比如10万个微软小冰杀入微信后又遭封杀,以及微信北京研发中心所从事的“模式识别”工作。

 

这个带有AI色彩的团队主要做的包括微信里面的语音转文字、声纹识别、电视节目中的摇一摇等。其研究方向其实是人工智能最基础的一些功能,包含语音识别、图像识别、语音合成、音频指纹、语义理解、数据挖掘等。而腾讯在语音语义识别方面上其实早已做了大量的尝试,比如语音记事本等产品。

 

从腾讯内部来看,在人工智能领域最可能有所建树的应该是腾讯云。2016年5月,腾讯云就展示了其人工智能、互联网金融、互联网医疗、云存储和流媒体等技术应用。

 

当然,腾讯还有搜狗。搜狗在2016年也将人工智能看作是重要的发展方向,搜狗输入法在在语义理解、识别和人机交互方面也在做大量的探索。但与BAT的其他几家相比,腾讯在发展人工智能技术方面,明显有些“漫不经心”。

 

腾讯云

 

中国移动:

 

有人可能会觉得把运营商和BAT摆在一起比较有些不伦不类,其实不然,先来看看中移动最新制定的战略规划,就能看出其在AI时代的野心了。

 

中国移动2017年的战略目标中,有两点十分引人关注,即“大连接”:移动终端、数字家庭、智能物联及行业信息化、数字服务;还有“家庭市场”:推动数字家庭市场应用普及,通过“魔百和”及“智能网关”等产品实现家庭连接客户超过6000万。

 

关于“大连接”,即扩大基础连接,创造更多市场商机,实现基础连接对象从人人互联向家庭、企业以及更广泛的万物互联扩展。2017年将中移动将加强渠道合作、积极布局蜂窝物联网和下一代车联网,目标之一是让智能设备连接数达到2亿。

 

关于“家庭市场”,即开放平台连接,提供更多优质内容和服务。通过智能家庭网关等平台,意在打破围绕家庭、智能家居的各个厂家终端的壁垒。众所周知,目前有很多像华为网关、小米网关之类的产品,各家各自为战,抢占自己的市场份额。但中移动明显有更大的野心,希望通过其基础通讯服务的优势,一统AI时代的家庭互联网接入。

 

而且中移动在内容及服务方面早已开始布局,加上其强大的规模化能力,极有可能成在AI时代异军突起,将传统通讯运营商的身份转换为人工智能相关服务的主要竞争者。


然而,无论如何布局,中移动在资源上的优势是否能够转化成市场竞争力,一直以来是备受质疑的。

 

中移动的“魔百和”

 

值得注意的,不管是BAT、中移动,还是科大讯飞,硬件都不是它们的强项。百度和科大讯飞的想法更倾向于开放平台,与第三方厂商合作;阿里有“天猫魔盒”,已经有几百万的量了,但主要是在大屏方面与其他厂商合作;运营商目前主要在做一些家庭智能网关、机顶盒等。

 

然而,亚马逊的成功是同时基于硬件和软件。当然,成功不可能只有一种模式,但用户体验只有一个标准。无论如何,这可能是目前国内各大厂商所面临较大的一个问题。

 

语音不是最终产品形态?

 

目前,亚马逊在智能语音设备方面的成功可能只是个开始。在不久的未来,就正如智能手机一样,为了穿透更多的内容和服务,亚马逊恐怕一定会回去做一个拥有视觉反馈功能的设备,甚至一定会去做一个全新的AI智能手机。

 

这意味着,将来所有带屏幕的设备都会具有AI功能,听得懂用户的话,而且能表现出来,比如电视、电脑、手机,这个趋势是非常确定的,只是时间问题。

 

中国消费者目前处在一个内容和服务高度发达的环境之下。如此多的视频、音乐、文学类网站,以及比任何国家都发达的O2O服务、在线支付体系,这些资源都已经在线准备好了,剩下的问题就是如何去穿透这些内容和服务了。

 

目前的难点在于,智能硬件刚起步,在线内容和服务提供商都在观望,是否有必要花费太多的成本去嵌入,是否有必要像亚马逊的Alexa Skills Kit(ASK)那样去训练AI的那些技能。


Echo通过各种“技能”穿透内容和服务

 

但当某个厂商有上千万的量时,内容和服务提供商将主动去训练AI技能、接入这个平台、让平台来穿透自己的内容和服务。

 

国内企业,比如阿里和腾讯,其优势就在于自己已经整合了大量的内容和服务。阿里投资影视娱乐内容,比如优酷土豆、阿里文学、虾米音乐、阿里游戏等,可能谁都不用求,直接接入自己的资源,就已经可以满足很大部分的用户需求了。

 

其他厂商也是一样,在上文提到的四大条件中各有各的优势,剩下的就是各厂商是否看清了趋势,是否决定投入巨大的资源去做这件事。

 

如上文提及,说到BAT和运营商比较欠缺的一点,可能就是在一体式智能硬件终端的设计制造方面。


硬件厂商在打造产品时也采取了不同的策略,目前在AI消费类产品这条赛道上的厂商大多关注垂直领域,较多的是儿童机器人,如360、布丁机器人等。还有专注视频会议的小鱼在家,在本届CES上与百度联合推出了一款视频对讲机器人,搭载的是百度即将于今年晚些时间正式推出的DuerOS,其团队主要来自老牌音视频厂商宝利通,主要打造音视频能力。


小鱼在家视频对讲机器人(左)、数字家圆“亲见”智能座机(右)

 

另外,一家专注AI及视频硬件终端的公司数字家圆近期推出的“亲见”智能座机也受到较多关注。其团队主要来自摩托罗拉,有多位重量级技术人员加入,从硬件到操作系统进行自主研发,围绕使用场景做的许多大胆创新让人印象深刻。其定位在于打造支撑AI的硬件能力,通过建立硬件开放平台,在未来AI和服务视频化到来时能够争夺属于自己的位置。

 

拿上一次以触屏为代表的交互革命为例,大到汽车,小到家电,都整合了触屏,但用得最多的还是手机,所以触屏时代的代表iPhone最终杀出重围。AI所引发的交互革命将是非常类似的,它也会进入汽车、电器等。但决胜场景将是那些高频使用的设备。

 

另外就是手机,毕竟这是一种最便捷的设备。但这并不意味着AI功能的实现都要以手机为入口,可能用户可以直接与空调、电视、冰箱来对话。AI将以一个多终端、多样化的形态呈现,但一定会有某些垄断性的、高频使用的入口。

 

2017CES上LG发布的搭载了亚马逊Alexa的冰箱

 

前锤子科技CTO、数字家圆副总裁钱晨对DT君表示,谷歌、微软、亚马逊这样的公司一定要去做自己品牌的硬件是一件非常值得思考的事情。因为AI时代到来,在全新的交互方式下,如果无法做到软硬一体的设计,就无法实现比较好的体验。

 

可能会有人问亚马逊为何选择做一个音箱,而不是一个带小屏幕的设备,或者直接是个智能电视?的确,大屏是AI时代设备的趋势,但就目前发展阶段来说,至少在中国国情下,大屏设备可能并不是一个号的选择。

 

首先是监管。比如IPTV的牌照只有电信、联通有;网上视频许可证只有7家有。如果要做视频内容,只能去绑定一家。

 

其次是在中国,今天的视频内容已经是群雄割据了:运营商在做机顶盒,通过补贴、赠送,已经达到几千万的量;创维、TCL、乐视等的智能电视也都在做自己的生态,有自己的入口和交互系统,切入难度很大;互联网公司比如阿里、小米也都在做自己的视频生态。鉴于这种情况,很难出现一家公司在大屏领域一统天下。

 

再者是大屏设备体验并不好,不能随时在线、随时响应,不是一种高频应用场景下的便捷方式。可能比较难形成垄断性入口。

 

毫无疑问,AI手机是肯定终将到来的。现在的问题是手机的使用习惯很难改变,从新场景切入更容易取得成功。等到AI软硬一体设计能达到极致体验后,AI手机才会出现。按现在的技术发展来看,可能还需要几年的时间。从这一点上看,亚马逊现在的策略非常类似与苹果从iPod过度到iPhone。

 

比较主观的判断是,亚马逊会从语音设备过度到带屏幕的设备,最终实现耳机+AI手机。至少苹果最新推出的AirPods获得如此高的评价,就多少反映了这一趋势。看似不起眼的无线耳机,事实上却是未来AI手机拼图的一部分。

 

AirPods这类产品是未来AI手机拼图的一部分?

 


亚马逊进不来,究竟谁更有优势?

 

亚马逊开放Alexa平台的目的其实是希望所形成的生态能以最快速度成长起来。亚马逊Alexa Skills Kit(ASK)是整合服务的,训练AI的技能来穿透服务,所以出现了Echo的技能每天新增100个的现象。而Alexa Voice Service(AVS)是用来整合终端的,换句话说就是整合用户,只要是搭载Alexa的终端,其用户就相当于被亚马逊整合了。

 

当某一个平台后端的服务和前端用户量巨大时,技术方面的优势其实就不那么重要了。很好的一个例子就是Windows Phone,不是因为其技术不好,而是因为其生态没有长起来,对用户和开发者来说都没有吸引力了。而安卓的成功恰恰是因为它的开源,所有的设备都可以使用,也意味着所有的用户都被抓到了。

 

亚马逊的聪明之处就在于看清了这两点:一是技术是否够领先?第二就是生态够不够强大?这两者是不可分割的。

 

其他厂商大量推出基于Alexa的设备,并不意味着Echo就会衰落,因为亚马逊的策略是抓住那些最高频的使用场景。

 

那么,鉴于目前国内的特殊情况,亚马逊要进来不容易,国内大厂谁最有机会?

 

目前看来,在技术方面,百度可能会把产品打造的比较完美,可能会具有比较好的软硬一体设计,但它在穿透服务和规模化方面一旦慢了,就可能出问题。比如阿里也做了一个设备,时间上之和百度差了几个月,在AI能力方面也比百度落后一点,但一旦阿里自己的几千个服务介入进来,用户量做起来,很可能会超越百度。鹿死谁手还很难说。

 

技术和规模化对第三方来说都是很大吸引力,都会像黑洞一样源源不断的将用户和第三方厂商吸引进来。但技术上的略微领先对用户来说可能不是第一位的,反而内容和服务的规模一旦形成较大差距,就很难去追赶了。

 

目前看来,几家大厂中,百度应该是把路径和模式看得最明白的;阿里次之,因为其内容和服务、规模化资源相对比较强。其实阿里和腾讯也都已经在做自己的AI技术。

 

现在大家可以看到,百度、阿里、腾讯、中移动都已经站在了AI时代的赛道上,各家的决心才是决胜的关键。虽然大家都知道AI重要,目前只看到百度是果断的转向AI技术,其他几家可能还在考虑到底要不要投入这么大资源,

 

像亚马逊一样快速整合并购,并投入上千人、四年时间在Echo这样一款产品上进行软硬件开发,需要超强的技术远见,更需要势在必得的决心。前的看法是,同时开发软硬件,自己做裁判员,又做运动员,别人如何跟你合作?但现在已经不是这个逻辑了。

 


欢迎关注DT君的科幻电影公众号:




招聘

编辑、视觉设计、视频策划及后期

地点:北京

联系:[email protected]


MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。

分享至朋友圈才是义举