专栏名称: 深度学习与图网络

关注图网络、图表示学习，最近顶会顶刊动态以及机器学习基本方法，包括无监督学习、半监督学习、弱监督学习、元学习等

SubgraphRAG：一种基于知识图谱的高效检索增强生成框架

深度学习与图网络 · 公众号 · · 2025-01-04 09:09

正文

SubgraphRAG：一种基于知识图谱的高效检索增强生成框架

尽管LLMs具备强大的语言理解和推理能力，但它们也暴露出了一些显著的缺点。尤其是：

幻觉问题 ：由于模型的输出仅依赖于其内部知识和上下文理解，LLMs有时会生成不真实或不准确的信息。
知识更新滞后 ：LLMs的知识主要来自预训练语料，其内容通常是静态的，无法反映最新的事实或动态变化的领域知识。
缺乏垂直领域知识 ：在特定专业领域（例如医学、法律或金融），LLMs难以生成具有高度准确性和细节性的答案。

为了解决上述问题，研究者提出了 检索增强生成 （Retrieval-Augmented Generation, RAG）的框架。这一框架通过外部知识源（如文档或知识图谱，Knowledge Graph, KG）的实时检索，为LLM提供了额外的上下文信息，从而改善生成质量。然而，基于知识图谱的RAG方法在实际应用中依然面临若干关键挑战：

多跳推理的复杂性 ：某些问题需要通过多个实体和关系链路进行推理，而传统的文本检索方法（如BM25或密集检索）在这类任务中的表现有限。
效率与精度的平衡 ：如何快速找到与问题相关的知识图谱子图，同时确保检索到的信息足够覆盖问题答案，是一个核心难题。
上下文窗口的限制 ：LLMs的上下文窗口有限，如何在不过度增加推理复杂度的前提下提供关键性信息，是另一个需要解决的问题。

GIT的研究团队提出了一种名为 SubgraphRAG 的创新框架，通过将轻量级子图检索机制与LLM推理相结合，有效地解决了上述问题。

1. 基本信息

论文标题 ：
Simple is Effective: The Roles of Graphs and Large Language Models in Knowledge-Graph-Based Retrieval-Augmented Generation
作者：
Mufei Li*, Siqi Miao*, Pan Li（Georgia Institute of Technology）
时间：2024年11月，arXiv预印版（arXiv:2410.20724v2）
论文链接 ：https://arxiv.org/abs/2410.20724
代码开源 ：https://github.com/Graph-COM/SubgraphRAG

SubgraphRAG提出了一种灵活、可扩展的知识图谱增强生成框架，通过子图检索和未微调的LLM推理相结合，实现了高效的知识整合和推理能力。以下将详细探讨其研究背景和设计方法。

2. 研究背景

2.1 知识图谱在生成任务中的角色

知识图谱是一种以实体（Entities）和关系（Relations）为基础构建的图结构，用于存储和组织大规模结构化知识。与传统的文本知识源相比，知识图谱的显著优势在于其能够明确表示实体之间的关系网络。例如：

知识图谱能够高效表示复杂的语义关系，从而减少信息冗余。例如，通过三元组 (Nvidia, Business Partnership, Tesla)，可以在一条简单关系中传递关于两家公司合作的明确信息。
知识图谱的可扩展性使得它在动态更新知识时更加高效，例如添加新的实体或修改已有关系，而无需重新处理整个数据集。

知识图谱逐渐被整合到检索增强生成（RAG）框架中，为LLMs提供额外的推理支持。这一方法被证明在需要深度推理的任务（例如跨多跳的问答任务）中，能够显著提升模型的表现。

2.2 基于知识图谱的RAG方法现状

尽管知识图谱为RAG提供了丰富的信息支持，但现有方法仍面临一些挑战：

检索的复杂性 ：许多问题不仅涉及单个实体，还需要跨越多个实体和关系链路。例如，回答“哪些组织与Elon Musk、Jeff Bezos和Bill Gates创立的公司有商业合作关系”这一问题时，需要从知识图谱中检索多个相关子图，并结合推理找到答案。
现有检索方法的局限性 ：传统方法（如BM25或余弦相似度检索）通常依赖于文本相似性，这种方式在处理复杂的结构化信息时表现不佳。
推理能力的局限 ：LLMs虽然具有强大的推理能力，但其上下文窗口和计算能力有限。如果提供的上下文过多或不相关，可能导致性能下降。

这些问题表明，当前的基于知识图谱的RAG方法尚未完全解决高效检索和精准推理之间的矛盾。

2.3 SubgraphRAG的研究目标

SubgraphRAG旨在解决上述挑战，提出了一种高效灵活的知识图谱子图检索方法，与未微调的LLM推理相结合。其目标包括：

高效检索 ：通过引入轻量级的检索机制，在大规模知识图谱中快速定位相关子图。
结构化推理 ：设计适配LLM能力的子图结构，确保其推理能力能够被充分利用。
减少幻觉生成 ：通过优化子图检索，提供与问题直接相关的上下文信息，减少不必要的推理干扰。

3. 方法

SubgraphRAG框架分为两个主要阶段： 子图检索 和 基于提示的推理 。以下将详细解析每一阶段的核心方法。

3.1 子图检索（Subgraph Retrieval）

3.1.1 子图检索问题的数学定义

知识图谱可以表示为一组三元组的集合：

其中，和分别表示头实体和尾实体，表示关系。对于给定的查询，目标是检索一个子图，该子图包含回答问题所需的所有关键信息。

3.1.2 子图检索的核心挑战

检索的复杂性 ：知识图谱通常包含数十亿个实体和关系，直接对整个图谱进行遍历显然不可行。
相关性评估 ：需要设计高效的评分机制，判断三元组是否与查询相关。
动态调整子图大小 ：为了适配不同LLM的上下文窗口，子图大小需要具有动态调整的能力。

3.1.3 SubgraphRAG的检索机制

SubgraphRAG提出了一种轻量级的多层感知机（MLP）模型，与方向性距离编码（Directional Distance Encoding, DDE）结合，实现高效检索。其核心机制包括以下几部分：

(1) 三元组打分机制

对于每个三元组，定义一个打分函数，表示该三元组与查询的相关性。打分函数的输入包括：

语义信息 ：通过预训练文本编码器对实体和关系进行嵌入，捕捉其语义特征。
结构信息 ：利用方向性距离编码（DDE）建模三元组与查询之间的图结构关系。

三元组打分函数的公式为：

其中，表示三元组的结构编码，表示MLP模型。

(2) 方向性距离编码（Directional Distance Encoding, DDE）

DDE是一种轻量级的结构信息编码方法，其设计灵感来源于图神经网络的距离编码技术。DDE通过以下步骤完成：

初始编码 ：对查询涉及的主题实体进行单热编码。
双向传播 ：在知识图谱中进行多轮传播，捕捉实体之间的方向性关系。例如，从头实体传播到尾实体，以及从尾实体反向传播。

SubgraphRAG：一种基于知识图谱的高效检索增强生成框架

正文

(adsbygoogle = window.adsbygoogle || []).push({}); SubgraphRAG：一种基于知识图谱的高效检索增强生成框架

1. 基本信息

2. 研究背景

2.1 知识图谱在生成任务中的角色

2.2 基于知识图谱的RAG方法现状

2.3 SubgraphRAG的研究目标

3. 方法

3.1 子图检索（Subgraph Retrieval）

3.1.1 子图检索问题的数学定义

3.1.2 子图检索的核心挑战

3.1.3 SubgraphRAG的检索机制

(1) 三元组打分机制

(2) 方向性距离编码（Directional Distance Encoding, DDE）

请到「今天看啥」查看全文

SubgraphRAG：一种基于知识图谱的高效检索增强生成框架