我们可以视这个现象为对话式AI生态的“四子围城”现象:
一、技术生态:为了满足家庭用户需求,对话式AI硬件必须有强大的技术解决能力。尤其要兼具连续对话能力、对话记忆能力、唤醒理解能力、情绪识别能力、知识图谱能力这五大能力,目前来看,DuerOS可谓市面上技术完成度最高的语音交互平台,在连续对话能力、长期对话记忆能力,以及语言识别精准度等领域,DuerOS都保持着世界记录。而这样的“AI最强”能力,体现在产品中,直接的用户感受就是DuerOS的产品会比同类产品聪明一大块,却丝毫没有更贵。这是因为技术本身带来了竞争区位。
最明显的对比,应该是DuerOS的语音硬件新品小度当中,有可以无唤醒词,自动收音连续对话的极客模式,这对于语音系统的灵敏度、语义理解速度和连续对话能力都是极强的考验。也是行业中一直在期待却无法达成的愿望。另一个技术秀,是在儿童模式的技术解决方案上。儿童的语音不清晰、逻辑不明确,AI想要分辨其意义,就需要强大的识别与连续理解能力。而这些在小度中已经变成了消费者可以感受的现实。
二、硬件生态:家庭生活必须与电视、大家电、智能家居三个生态结合,才能带来家庭智能入口的解决效应。而这就要求对话式AI平台联动的品牌与硬件足够丰富,不会给消费者带来选品困难与成本负担。连接最多硬件,与电视、大家电等品牌不断签订生态合作的DuerOS目前来看已经完成了这一任务,比如小度可以作为创维电视的语音遥控器。很明显,更多语音交互集成方案还在路上。
三、内容生态:内容是语音硬件存在的根本,尤其是儿童内容是撬动家庭核心需求的能力。而依托百度声音内容存量,尤其是重点打通儿童内容生态后,这个能力也已经在DuerOS和小度的覆盖范围内。目前,DuerOS已经连接有声内容超过1000万小时,儿童节目83万+,内容生态已经相对完备。
四、技能生态:对话式AI的另一个需求,是教育、问答、游戏互动等能力,这个能力不仅关乎儿童AI市场的存在,阖家娱乐场景的确立,也关乎未来无尽的想象力。率先搭建和商业化技能平台的DuerOS平台,也没有在这一层面失利。
这四大生态,每一个都关乎智能音箱的成败,并且又非朝夕之功可以建成。有了“四子围城”的保障后,对话式AI才可以轻取市场的核心部分。