在多个垂直领域,问答 (QA) 是使用对话式 AI 交付业务价值的最快方式之一。非正式地说,QA 是将用户查询映射到给定上下文的答案的任务。这个开放式的定义最好通过下面的例子来理解:
Q:
NVIDIA 的总部在哪里?
背景:
NVIDIA 公司
(en-VID-ee-\u0259)
是一家美国跨国技术公司,总部设在
Santa Clara, California
,在特拉华州注册成立。它为游戏和专业市场设计图形处理单元 (GPU) ,以及为移动计算和汽车市场设计系统芯片单元 (SoC)。其主要的GPU产品线标记为
\”GeForce\”
,与
AMD
的
\”Radeon\”
产品直接竞争。NVIDIA 通过其手持
Shield Portable
、平板电脑 Shield、安卓电视 Shield 以及云游戏服务
GeForce Now
扩大了在游戏行业的影响力。
除了 GPU 制造,NVIDIA 还为研究人员和科学家提供并行处理能力,使他们能够高效地运行高性能应用程序。它们被部署在世界各地的超级计算机站点。最近,该公司进军移动计算市场,为智能手机和平板电脑以及汽车导航和娱乐系统生产 Tegra 移动处理器。除了 AMD,它的竞争对手还包括英特尔和高通。”
A:
Santa Clara, California
这个例子很容易用深度学习 (DL) 模型来回答。DL 模型使用从
Wikipedia
摘录中提取的上下文来查找跨度对应的答案。有大量的开放数据集和模型来解决这个简单的任务,最常用的是斯坦福问答数据集
(SQuAD)
。通常,这被称为开放域QA。
NVIDIA NeMo
已经提供了一个将最先进的 QA 模型应用于此任务的很好的例子。但是,它确实假定您已经有了上下文。在以 DPR (密集通道检索)的形式收集给定问题的上下文这一“第一阶段”上,已经进行了大量的研发工作。但是,如果您没有一个看起来像训练这些开放域IR模型的训练材料的数据集 (即
Wikipedia
),那该怎么办?相反,如果你只是有一些你想要回答问题的事实集合呢?
在这篇文章中,我们将介绍另一种 QA 方法,即依靠知识图而不是上下文文本来回答问题。使用训练有素的神经机器翻译模型将问题转换为图形查询,我们可以有效地访问存储在知识图中的丰富特征。
原文链接:
https://developer.nvidia.com/blog/