这两天,因为锤子手机M1而大火的科大讯飞,关注度大有超过锤子的势头,股价更是连续上涨。不管怎么样,一场发布会能够让锤子M1和科大讯飞同时占据舆论头条,这可能是互联网行业里一场可以写进教科书的营销。
在沙龙君看来,科大讯飞能够突然火起来其实并不意外。因为科大讯飞在中国语音市场的占有率,打个比方就像目前无人机市场中的大疆,拥有绝对的领先优势。今日的走红,绝非一蹴而就。
根据第三方研究报告统计数据显示,科大讯飞占有中文语音技术市场70%以上市场份额。累计每日为超过20亿人次,15万开发伙伴和7亿终端用户提供语音及人工智能交互服务。
可以说,科大讯飞的意外走红一定是有着必然因素,最根本的还是与自身的崛起密不可分。
科大讯飞于1999年成立,初期主要得益于电信增值服务的快速发展。根据《通信世界》2006年的一篇报道,“我国语音技术与应用发展迅速,尤其是电信增值服务领域成为最直接的受益群体。中国电信的号码百事通、中国移动的语音门户、中国联通的声动炫铃、中国网通的电话听网,电讯盈科的通讯助理等电信增值服务都充分利用了语音技术。“
而这些语音技术的解决方案服务商恰恰就是科大讯飞。科大讯飞一直在企业级市场深耕多年,覆盖诸多领域,不少为公众熟知的产品语音功能也几乎都是科大讯飞提供的语音接口。
进入2010年之后,伴随着智能手机的兴起,科大讯飞意识到移动互联网语音听写时代即将到来,于是发布了全球首个移动互联网智能语音交互平台——“讯飞语音云”。
而与中国移动的联姻,则让科大讯飞如虎添翼。2013年,中国移动宣布向安徽科大讯飞投资2.15亿美元,获得15%的股份成为第一大股东。此次合作,为科大讯飞的科研技术投入与商业化探索提供了充足的资金保障与时间保障。
事实上,与安卓手机品牌的合作,科大讯飞也已有先例。2015年1月,科大讯飞与中国移动合作的“结晶”灵犀语音助手替代了Google Now成为新品Moto X在中国大陆的唯一语音助手合作伙伴。
正是因为有多年的积淀, 科大讯飞火起来只需要一个时机。于是,在罗永浩自身强大营销光环之下,以及与锤子的良好结合,科大讯飞终于火了。
对于媒体和舆论的欢呼, 在沙龙君看来多少有些过于乐观。为什么这么说呢,在当前的情况,将语音转换为文字的使用场景,主要是存在于文字从事工作群体中,尤其是编辑记者等使用频次较高,而这只是切中了部分特定人群的痛点,总体来说,比例并不大。
当然,将语音转换为文字只是科大讯飞语音技术在消费市场的应用。基于通过与各大软硬件厂商合作的方式,科大讯飞语音技术可以覆盖更多的手机用户,只是语音识别依旧是一个非高频使用的功能,并不能带来更多的商业价值。
事实上,除了 科大讯飞,其他语音识别软件也都面临同样的问题。那么,语音识别技术的未来,或者在消费市场的突破点在哪里呢?
综合来看,人工智能才是语音技术未来发展的趋势 。当然,科大讯飞也已经意识到这一年,2015年,科大讯飞发布了号称对人工智能产业具有里程碑意义的人机交互界面——AIUI。
其合作伙伴覆盖了移动应用、智能家居、可穿戴设备、机器人等几个领域,包括滴滴、高德、美的、叮咚音响等品牌以及开心熊宝、科大输入法等自有品牌。除此之外,科大讯飞还和京东于2015年达成战略合作,成立公司共同筹资1.5亿元,在智能家居和语音技术领域展开全面合作,专注智能家居业务的拓展。
可以看出,科大讯飞的布局已经十分广泛,以语音交互技术为核心的人工智能开放平台,已经建立起一个庞大合作生态圈。
不过,科大讯飞布局人工智能却存在一个非常严重的问题,如果仅提供了一个语音识别技术,倘若如果不能和后台海量的数据以及有有用信息结合起来,形成一个完善的服务链,商业价值就较为有限。
科大讯飞固然可以通过开放平台渗透到各个行业,与各大企业进行合作,积累起了海量的数据,但是大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。 如何有效处理这些数据,将海量无序的数据转换为有用的数据,并非是科大讯飞的强项。
在这一点上,搜索引擎更具有优势。不仅有海量用户行为数据的挖掘能力,在自然语言处理能力和深度学习领域也都一直走在前沿,这是实现真正的人工智能的关键所在。
在IOT万物互联时代,人工智能的进化,只有精准的语音识别与交互技术还不够,还必须有大量的数据作为原料,以及更强的自然语言进化能力。
以谷歌语音技术为例,谷歌通过优化搜索引擎服务,后台的人工智能随着用户的使用而不断进化,使用的用户越多,搜索引擎也越优化。优化之后,语音自然交互能力也就越强。再例如,苹果的语音识别技术Siri也是基于深度学习技术与人工智能理论构建的。
无可否认的是,缺乏类似百度等搜索引擎的支撑,这成为科大讯飞语音技术实现人工智能的最大短板所在。
从未来的趋势来看,语音技术要想在更多场景上普及应用,就必须实现更高级的人工智能。要实现人与机器的自然交流,更不能重走手机这套语音对话规则,机器要从文字中理解说话人的含义才是最重要的。
只有真正推动语音从识别走向交互的自然体验,从而向着人工智能再次迈进一步。倘若做不到这一点,走向没落的全球语音识别巨头Nuance或许就是前车之鉴。世界上有超过80%的语音识别都用过Nuance识别引擎技术,其语音产品可以支持超过50种语言,在全球拥有超过20亿用户。
然而,当苹果、亚马逊、三星、Google、Facebook等公司开发自己的语音技术,Nuance在技术上的优势逐渐不在,客户慢慢流失。在移动互联网时代,Nuance由技术提供商向产品厂商转型同样举步维艰,最终面临被收购的结局。
回头再看,任何一个叫巨头,在盛世之下,都有会不轻易为外人察觉的隐忧。 那么,科大讯飞能否以史为鉴,避免Nuance式的悲剧呢?
推荐:
阿里前CEO卫哲万字长文:B2B的春天已到,关注这十大核心问题