在这种背景下,搜索引擎将扮演三种角色,其一是命令与执行,通过问答完成定机票、餐饮等需求;第二类是情感陪护,通过问答完成情感层面的陪伴;第三类是寻求建议,人和机器就像朋友,有问题会去询问,机器听到问题后,经过思考,在他的知识体系下给出答案、建议或评论。这就要求机器要够一定的能力,在此基础上建立完整的知识体系,把这些内容结合直接给出答案——搜狗的人工智能答题机器人就是第三类角色一个很好的尝试,他已经能够和人类同台竞技强大题目,并表现出压倒性的优势。
人工智能时代,搜索背后的技术也发生了一些变化,搜索结果不再是匹配,而是走到了理解的角度。搜狗的理解是从符号主义过渡到连接主义——以前把词和词之间定义为高维空间向量的相互独立的向量,通过这种分布式的表达,需要把它放到一个相对低维的、但是连续的向量中。在词理解的基础上,利用CNN、RNN这种目前比较流行的网络结构,对句子、篇章的结构进行建模,对整个比较大的单元理解。有了前面这些理解,在搜索场景下,搜狗可以把用户的查询、用户的问题,把网页文档的信息都用DNN、CNN、RNN这种网络结构去表征,最终通过用户已经在搜索引擎上发生的行为,在大量的海量的监督数据里面,进行批量的监督学习。
在演讲的最后,许静芳这样总结到:“搜索引擎天生就是用来满足人的好奇心和求知欲的,在今天人工智能的时代里,我们希望在之前的基础之上,做到语义的理解与知识体系的构建,最终达到让搜索引擎成为人类的朋友——有问题,就直接用自然语言跟它交流,它能直接给你回答。”