答马化腾问：智能语音才是下一个十年的超级入口

望月的博客 · 公众号 · · 2018-10-24 12:48

正文

十年前，马化腾、张小龙、KK、王小川、李开复等10个人在知乎发起了“寻找中国互联网思想者”活动。

他们每人问一个问题，然后寻求优秀的答案。

当时，张小龙关心的是 “手机会不会取代电脑” 。

而马化腾问的则是 “互联网下一个十年的互联网升级的大致方向” 。

时隔十年，马化腾再次在知乎发问，还是关心下一个十年，这次他的问题是 “未来十年哪些基础科学突破会影响互联网科技产业？产业互联网和消费互联网融合创新，会带来哪些改变” 。

十年前，我只是一个吃瓜围观群众，这一次，我想当一回参与者。

以下是我的回答。

看了下大家的答案，要么深奥，要么太遥远。

我说一个可能迫在眉睫，又是腾讯可能没有特别重视的，那就是 “智能语音” ，或者说 “人工智能的语言识别与处理的问题” 。

为什么说“ 迫在眉睫 ”？因为智能语音很有可能是接下来十年的超级入口。

在PC互联网时代，主要入口是搜索引擎，例如Google、百度；移动互联网时代则是超级APP，例如微信。

随着物联网和5G技术的到来，越来越多的硬件可以便捷入网，这些硬件设备是散落各处的，比如智能穿戴设备、车联网、智能家居等等，唯一能将他们统一起来的，只能是智能语音。

拿亚马逊Echo的Alexa来说，它目前就支持3500多个品牌、2万多种智能家居设备和耳机、手机等100多种第三方设备，这种趋势会越来越明显。

而且，智能语音意味着交互方式的革命。

在PC时代，我们通过键盘鼠标来输入;移动互联网时代，通过触摸的方式来输入，是一个进步，但依然是靠手和眼.而智能语音则解放了双手和眼睛，靠口和耳来进行交互，不但是一个划时代的进步，而且更加如何人类的交流方式。

近两年，智能语音的发展速度是惊人的。

科技调查公司Canalys的数据，截止2017年底，全球智能语音设备装机量是4000万台，预计今年年底会超过1亿台。

而Ovum公司则预计到2021年，智能语音助手的数量将和全球人口一样多，要知道，手机达到这一数量，可是花了整整30年的时间。

也就是说，在接下年的十年里，人们使用的是手机、智能穿戴设备、车辆还是音响，这并不重要，这些设备只是适应不同场景的需要，重要的是这些设备都是通过智能语音来唤醒和交互.如果论便携的话，可能一个隐藏在耳朵里的小耳机就足够了。

当然，智能语音的发展也面临一个大难题，那就是语境的问题。

智能语音要准确理解人类指令，必须具备识别语言句子的语义的能力，在固定的系统中，语义是确定的。正因为这样，物理符号系统可以形式化。

但是，在语言的运用中则不然，语言的意义是随语境的不同而有差别的，这也是为什么目前的Siri、Alexa和Watson有时很傻的原因。

一个完全理解语境的智能语音系统，应该也就可以通过图灵测试了，这似乎有点遥不可及，但目前能做的，就是让其无限接近。

对语言和语境的理解需要大量的数据和场景来训练，这也是从国外的亚马逊、Google、苹果，到国内的阿里巴巴、百度、京东、联想，都在力推智能音响设备的原因。

并不是说智能音响很重要，而是它可以为音响背后的智能语音系统提供很好的训练场景和数据。