专栏名称: 机器学习研究会

机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织，旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外，协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。

【学习】未来已来！阿里小蜜AI技术揭秘

机器学习研究会 · 公众号 · AI · 2017-02-17 18:59

正文

点击上方“机器学习研究会”可以订阅哦

摘要

转自：阿里技术

1. 双11的挑战与服务模式的转型

在全球人工智能领域不断发展的今天，包括Google、Facebook、Microsoft、Amazon、Apple等互联公司相继推出了自己的智能私人助理和机器人平台，智能人机交互成为各大公司在人工智能战场上激烈竞争的入口级领域。智能人机交互通过拟人化的交互体验逐步在智能客服、任务助理、智能家居、智能硬件、互动聊天等领域发挥巨大的作用和价值。

在2015年7月，我们阿里也推出了自己的智能私人助理-阿里小蜜，一个围绕着电子商务领域中的服务、导购以及任务助理为核心的智能人机交互产品。通过电子商务领域与智能人机交互领域的结合，提升传统电商领域的能效，带来传统服务行业模式的变化与体验的提升。

1.1智能人机交互带来服务行业模式的变化

传统的服务行业是一个人力密集型的行业，就拿我们阿里巴巴双11狂欢节来说，无论是对于阿里直接对外的服务(消费者服务和商家服务)还是淘宝商家的服务都面临着当天服务量的巨大井喷，人力扩容成为每年阿里以及商家巨大的挑战。传统人力密集型服务模式(以自营客服、外包客服和云客服为主的服务模式)亟待被颠覆和改变，围绕着以阿里小蜜产品为核心，通过智能人机交互与人工服务相结合的模式才是未来真正的服务模式。机器通过智能化技术处理掉绝大部分的简单、重复等可识别处理的问题，对于解决不了的问题流向人工，让人提供更有温度也更加专业的服务。通过智能+人工相结合的模式探索，在今年的双11期间，阿里小蜜整体智能服务量达到643万，其中智能解决率达到95%，智能服务在整个服务量(总服务量=智能服务量+在线人工服务量+电话服务量)占比也达到95%，成为了双11期间服务的绝对主力。

1.2 智能人机交互带来服务体验的提升

在体验维度，由于机器的运算速度远超于人，因此智能人机交互可以带来提升：智能交互相比人工可以达到急速的秒级体验，而人的服务通常需要一定时间的回复等待。并且在互动领域，智能人机交互也带来了一种新的模式和新的玩法，带来更多价值。

阿里小蜜整体体系图如下：

通过1年多阿里小蜜在阿里业务体系内的不断尝试和摸索，今年在电子商务生态圈范围内，在基于千牛的买卖家生态圈、基于钉钉的企业生态圈上，我们将阿里小蜜进行平台化开放，同时赋能给我们商家和企业用户。未来我们期望通过不断的领域数据和技术模型的积累，能够在阿里其他生态圈(例如：阿里云)逐步进行开放，赋能更多电子商务生态圈领域。

阿里小蜜平台结构图如下：

阿里小蜜在各个领域系统示例截图：

3. 阿里小蜜技术实践

3.1 智能人机交互系统

智能人机交互系统，俗称：chatbot系统或者bot系统，我们核心需要做的事情是理解人类的语言意思，进而给予合理的答案或者Action。

人机交互基本流程如下：

其核心部分就是NLU(自然语言理解)，通过对话系统处理后最后通过自然语言生成的方式给出答案。一段语言如何理解对于计算机来说是非常有难度的，例如：“苹果”这个词就具备至少两个含义，一个是水果属性的“苹果”，还有一个是知名互联网公司属性的“苹果”。因此在阿里小蜜这样在电子商务领域的场景中，我们先采用分领域分层分场景的方式进行架构抽象，然后再根据不同的分层和分场景采用不同的机器学习方法进行技术设计。首先我们将对话系统从分成两层：

1、意图识别层：识别语言的真实意图，将意图进行分类并进行意图属性抽取。意图决定了后续的领域识别流程，因此意图层是一个结合上下文数据模型与领域数据模型不断对意图进行明确和推理的过程；

2、问答匹配层：对问题进行匹配识别及生成答案的过程。在阿里小蜜的对话体系中我们按照业务场景进行了3种典型问题类型的划分，并且依据3种类型会采用不同的匹配流程和方法：

1. 问答型：例如“密码忘记怎么办？”→ 采用基于知识图谱构建+检索模型匹配方式

2. 任务型：例如“我想订一张明天从杭州到北京的机票”→ 意图决策+slots filling的匹配方式

3. 语聊型：例如“我心情不好”→ 检索模型与Deep Learning相结合的方式

3.2 阿里小蜜意图识别的技术方案

通常在意图识别领域我们将其抽象成为机器学习中的分类问题来解决，在阿里小蜜的技术方案中除了传统的文本特征之外，考虑到本身在对话领域中存在语义意图不完整的情况，我们也加入了用实时、离线用户本身的行为及用户本身相关的特征，通过深度学习方案构建模型，对用户意图进行预测。如下图：

在基于深度学习的分类预测模型上，我们有两种具体的选型方案：一种是多分类模型，一种是二分类模型。多分类模型的优点是性能快，但是对于需要扩展分类领域是整个模型需要重新训练；而二分类模型的优点就是扩展领域场景时原来的模型都可以复用，可以平台进行扩展，缺点也很明显需要不断的进行二分，整体的性能上不如多分类好，因此在具体的场景和数据量上可以做不同的选型。整体的基本技术思路就是将行为因子与文本特征分别进行Embedding处理，通过向量叠加之后再进行多分类或者二分类处理。这里的文本特征维度可以选择通过传统的bag of words的方法，也可使用Deep Learning的方法进行向量化。具体如下图：

目前主流的智能匹配技术分为如下4种方法：

1. 基于模板匹配(Rule-Based)

2. 基于检索模型(Retrieval Model)

3. 基于统计机器翻译模型(SMT)

4. 基于深度学习模型(Deep Learning)

在阿里小蜜的技术场景下，我们采用了基于模板匹配，检索模型以及深度学习模型为基础的方法原型来进行分场景(问答型、任务型、语聊型)的会话系统构建。

原文链接：

https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247484309&idx=1&sn=31da838b2fbd4647f4b84f94a66c104f&chksm=e9293e9ade5eb78cd4a210bcd82df0d2ea6fc64d4231aedeb86395f2d1219a0ec40d9de301bb&scene=0&pass_ticket=VUqxS2aL3X2YGDVuKj5zoMcqGJOEhECsTeZo7aI6aLw%3D#rd

“完整内容”请点击【阅读原文】

↓↓↓