正文
前面介绍了
对话系统的技术原理之 NLU
模块,本文主要介绍对话系统的技术原理中的 DST 模块。DST(Dialogue State Tracking)对话状态追踪模块是以用户动作,上一轮的对话状态和相应的系统动作作为输入,输出是 DST 模块得到的当前对话状态 s。
对话状态的表示通常由以下三部分组成:
-
目前为止的槽位填充情况
-
本轮对话过程中的用户动作
-
对话历史
其中,槽位的填充情况通常是最重要的状态表示指标。
由于语音识别技术和自然语言本身存在歧义性等原因,NLU 模块的识别结果往往与真实情况存在一定的差异。所以,NLU 模块的输出往往是带有概率的,即每个可能的结果有一个相应的置信度值,因此,DST 在判断当前的对话状态有两种不同的选择:
1-Best 方式
和
N-Best 方式
。
1. 1-Best 方式
1-Best 方式是指 DST 判断当前对话状态时只考虑置信度值最高的情况,因此维护对话状态的表示时,只需要等同于槽位数量的空间。
2. N-Best 方式
N-Best 方式是指 DST 判断当前对话状态时会综合考虑所有槽位的所有置信度值,因此每个槽位的 N-Best 结果都需要考虑和维护,并且最终还需要维护一个槽位组合在一起的整体置信度值,将其作为最终的对话状态判断依据。
实现 DST 模块的主要方式有:基于 CRF 的序列跟踪模型、基于 RNN、LSTM 的序列跟踪模型等。
作者:
关于我
备注:转载请注明出处。
如发现错误,欢迎留言指正。