十年前,马化腾、张小龙、KK、王小川、李开复等10个人在知乎发起了“寻找中国互联网思想者”活动。
他们每人问一个问题,然后寻求优秀的答案。
当时,张小龙关心的是
“手机会不会取代电脑”
。
而马化腾问的则是
“互联网下一个十年的互联网升级的大致方向”
。
时隔十年,马化腾再次在知乎发问,还是关心下一个十年,这次他的问题是
“未来十年哪些基础科学突破会影响互联网科技产业?产业互联网和消费互联网融合创新,会带来哪些改变”
。
十年前,我只是一个吃瓜围观群众,这一次,我想当一回参与者。
以下是我的回答。
看了下大家的答案,要么深奥,要么太遥远。
我说一个可能迫在眉睫,又是腾讯可能没有特别重视的,那就是
“智能语音”
,或者说
“人工智能的语言识别与处理的问题”
。
为什么说“
迫在眉睫
”?因为智能语音很有可能是接下来十年的超级入口。
在PC互联网时代,主要入口是搜索引擎,例如Google、百度;移动互联网时代则是超级APP,例如微信。
随着物联网和5G技术的到来,越来越多的硬件可以便捷入
网,这些硬件设备是散落各处的,比如智能穿戴设备、车联网、智能家居等等,唯一能将他们统一起来的,只能是智能语音。
拿亚马逊Echo的Alexa来说,它目前就支持3500多个品牌、2万多种智能家居设备和耳机、手机等100多种第三方设备,这种趋势会越来越明显。
而且,智能语音意味着交互方式的革命。
在PC时代,我们通过键盘鼠标来输入;移动互联网时代,通过触摸的方式来输入,是一个进步,但依然是靠手和眼.而智能语音则解放了双手和眼睛,靠口和耳来进行交互,不但是一个划时代的进步,而且更加如何人类的交流方式。
近两年,智能语音的发展速度是惊人的。
科技调查公司Canalys的数据,截止2017年底,全球智能语音设备装机量是4000万台,预计今年年底会超过1亿台。
而Ovum公司则预计到2021年,智能语音助手的数量将和全球人口一样多,要知道,手机达到这一数量,可是花了整整30年的时间。
也就是说,在接下年的十年里,人们使用的是手机、智能穿戴设备、车辆还是音响,这并不重要,这些设备只是适应不同场景的需要,重要的是这些设备都是通过智能语音来唤醒和交互.如果论便携的话,可能一个隐藏在耳朵里的小耳机就足够了。
当然,智能语音的发展也面临一个大难题,那就是
语境
的问题。
智能语音要准确理解人类指令,必须具备识别语言句子的语义的能力,在固定的系统中,语义是确定的。正因为这样,物理符号系统可以形式化。
但是,在语言的运用中则不然,语言的意义是随语境的不同而有差别的,这也是为什么目前的Siri、Alexa和Watson有时很傻的原因。
一个完全理解语境的智能语音系统,应该也就可以通过图灵测试了,这似乎有点遥不可及,但目前能做的,就是让其无限接近。
对语言和语境的理解需要大量的数据和场景来训练,这也是从国外的亚马逊、Google、苹果,到国内的阿里巴巴、百度、京东、联想,都在力推智能音响设备的原因。
并不是说智能音响很重要,而是它可以为音响背后的智能语音系统提供很好的训练场景和数据。