专栏名称: 机器学习研究会
机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织,旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外,协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。
目录
相关文章推荐
量子位  ·  高通最新5G芯片,AI爆了 ·  昨天  
爱可可-爱生活  ·  [CL]《Interrogating ... ·  昨天  
新智元  ·  LeCun世界模型再近一步!Meta研究证明 ... ·  2 天前  
新智元  ·  飞书多维表格+DeepSeek ... ·  3 天前  
51好读  ›  专栏  ›  机器学习研究会

自然语言理解-从规则到深度学习

机器学习研究会  · 公众号  · AI  · 2017-08-22 23:09

正文

摘要: 自然语言理解是人工智能的核心难题之一,也是目前智能语音交互和人机对话的核心难题。之前写过一篇文章自然语言理解,介绍了当时NLU的系统方案,感兴趣的可以再翻一番,里面介绍过的一些内容不再赘述。本文详细讨论了自然语言理解的难点,并进一步针对自然语言理解的两个核心问题,详细介绍了规则方法和深度学习的应用。


引言

自然语言理解是人工智能的核心难题之一,也是目前智能语音交互和人机对话的核心难题。维基百科有如下描述[1]:


Natural language understanding (NLU) is a subtopic of natural language processing in artificial intelligence thatdeals with machine reading comprehension. NLU is considered an AI-hard problem.


对于AI-hard的解释如下:


In the field of artificial intelligence, the most difficult problems are informally known as AI-complete or AI-hard,implying that the difficulty of these computational problems is equivalent to that of solving the central artificial intelligence problem—making computers as intelligent as people, or strong AI.


简言之,什么时候自然语言能被机器很好的理解了,strong AI也就实现了~~


之前写过一篇文章自然语言理解,介绍了当时NLU的系统实现方案,感兴趣的可以再翻一番,里面介绍过的一些内容不再赘述。那篇文章写于2015年底,过去一年多,技术进展非常快,我们的算法也进行了大量升级,核心模块全部升级到深度学习方案。本文主要结合NUI平台中自然语言理解的具体实现,详细的、系统的介绍意图分类和属性抽取两个核心算法。如下图所示,第一个框中是意图分类,第二个框中是属性抽取。



对于整个NUI平台的介绍可以参考孙健/千诀写的从“连接”到“交互”—阿里巴巴智能对话交互实践及思考。

自然语言理解的难点

为什么自然语言理解很难?本质原因是语言本身的复杂性。自然语言尤其是智能语音交互中的自然语言,有如下的5个难点:


1. 语言的多样性


一方面,自然语言不完全是有规律的,有一定规律,也有很多例外;另一方面,自然语言是可以组合的,字到词,词到短语,短语到从句、句子,句子到篇章,这种组合性使得语言可以表达复杂的意思。以上两方面共同导致了语言的多样性,即同一个意思可以有多种不同的表达方式,比如:


  • 我要听大王叫我来巡山

  • 给我播大王叫我来巡山

  • 我想听歌大王叫我来巡山

  • 放首大王叫我来巡山

  • 给唱一首大王叫我来巡山

  • 放音乐大王叫我来巡山

  • 放首歌大王叫我来巡山

  • 给大爷来首大王叫我来巡山

2. 语言的歧义性


在缺少语境约束的情况下,语言有很大的歧义性,比如:



  • 我要去拉萨

  • 火车票?

  • 飞机票?

  • 音乐?

  • 还是查找景点?



3. 语言的鲁棒性


语言在输入的过程中,尤其是通过语音识别转录过来的文本,会存在多字、少字、错字、噪音等等问题,比如:


  • 错字

  • 大王叫我来新山

  • 多字

  • 大王叫让我来巡山

  • 少字

  • 大王叫我巡山

  • 别称

  • 熊大熊二(指熊出没)

  • 不连贯

  • 我要看那个恩花千骨

  • 噪音

  • 全家只有大王叫我去巡山咯


4. 语言的知识依赖


语言是对世界的符号化描述,语言天然连接着世界知识,比如:


  • 大鸭梨

  • 除了表示水果,还可以表示餐厅名

  • 七天

  • 除了表示时间,还可以表示酒店名

  • 总参

  • 除了表示总参谋部,还可以表示餐厅名

  • 天气预报

  • 还是一首歌名

  • 晚安

  • 这也是一首歌名


5. 语言的上下文


上下文的概念包括很多内容,比如:


  • 对话上下文

  • 设备上下文

  • 应用上下文

  • 用户画像

  • ...


U:买张火车票
A:请问你要去哪里?
U:宁夏


这里的宁夏是指地理上的宁夏自治区


U:来首歌听

A:请问你想听什么歌?
U:宁夏


这里的宁夏是指歌曲宁夏

意图分类的实现方法

意图分类是一种文本分类。主要的方法有:


  • 基于规则(rule-based)

  • CFG

  • JSGF

  • ……


  • 传统机器学习方法

  • SVM

  • ME

  • ……







请到「今天看啥」查看全文