专栏名称: 知识图谱科技
务实的人工智能布道者。跟踪介绍国内外前沿的认知智能技术(知识图谱,大语言模型GenAI)以及医药大健康、工业等行业落地案例,产品市场进展,创业商业化等
目录
相关文章推荐
哎咆科技  ·  NVIDIA携手联发科杀回手机市场?没准真能成 ·  16 小时前  
哎咆科技  ·  干货:满血DeepSeek汇总,让你告别服务 ... ·  昨天  
EETOP  ·  任正非:缺芯少魂已减弱 ·  3 天前  
EETOP  ·  突破极限!1mm³ 存储 TB级! ·  4 天前  
51好读  ›  专栏  ›  知识图谱科技

企业级大模型智能体为什么需要融合知识图谱- Stardog的Voicebox实践

知识图谱科技  · 公众号  ·  · 2024-12-24 18:07

正文

摘要

企业级GenAI需要将大型语言模型(LLMs)与知识图谱(Knowledge Graphs)相融合,以实现精确、全面且无幻觉的结果,从而克服当前方法(如检索增强生成(RAG))的局限性,正如Stardog的Voicebox平台所展示的。

关键要点

- **LLMs与知识图谱结合**:此组合能够提供更高的精确性和召回率。

- **大型语言模型的幻觉问题**:幻觉问题在LLMs中普遍存在,单纯增大模型规模无法解决,且可能对企业声誉造成风险。

- **RAG的局限性**:检索增强生成在上下文窗口大小和可控性方面存在不足,而且无法访问文件之外的数据。

- **Voicebox平台的优势**:Stardog的Voicebox平台通过语义解析提供了无幻觉的替代方案,整合了LLM与KG的能力。

- **统一平台的重要性**:一个能够处理RAG、GraphRAG以及语义解析的统一平台对企业AI至关重要,以应对各种幻觉敏感度问题。

- **知识图谱的重要性**:知识图谱为LLM输出提供现实基础,统一结构化和非结构化数据源,提升GenAI的安全性和准确性。

- **自动化知识图谱创建**:Stardog的平台利用LLMs自动化知识图谱的创建与维护,简化了流程,使专业知识人士能够有效构建和管理企业知识图谱。

正文

为了在 AI 中获得最佳结果,企业需要一个提供 LLM 和知识图谱最佳功能的平台,它需要这种组合有两个原因:

  1. 精度 。为了获得最精确的结果,LLM 和 KG 必须共同努力:前者理解用户意图,后者为前者奠定基础。

  2. 召回 。为了获得最全面的结果,LLM 和 KG 必须协同工作:前者处理非结构化数据(即文档),后者处理其他所有内容(即结构化和半结构化数据,即数据库记录)。


最近在我参加的一次会议上,一位真正的 GenAI 基础设施领导者向我保证,作为对我对 RAG 的异端邪说的回应,幻觉是可以的,因为模型越来越大、越来越强大,而 RAG 致力于“增强”模型输出。

但这并不好,不是真的。RAG 增强了 LLM 输出; 但问题不在于 RAG 是否改善了通用LLM。问题实际上是,对于任何特定的用例,撒多少谎是可以的?您的用例可接受的幻觉频率是多少?

幻觉的频率很重要,因为幻觉通常(但并非总是)只是坏的;而且他们很常见!这是最新的幻觉排行榜。这就像是一件非常普遍的事情,任何将 GenAI 应用程序交付到生产环境的人都可以证明这一点。

文本支持问题的未回复率,来源:Lech Mazur

鉴于 Stardog 的市场专注于受监管的行业,我们解决了没有可接受算法一本正经胡说八道水平的使用案例。

更糟糕的是,人们认为,随着模型变大,幻觉问题会消失。但这可能不会很快发生,如果有的话。如果你同意《自然》杂志上的一项新研究(“更大、更可指导的模型变得不那么可靠”),该研究表明模型越复杂,它们就越有可能出错——

Schellaert 的团队研究了现代 LLM 的三大系列:Open AI 的 ChatGPT、Meta 开发的 LLaMA 系列和 BigScience 制造的 BLOOM 套件。他们发现了所谓的极端慌性主义,即对我们一无所知的事情发表意见的倾向。由于规模的增加,它开始出现在 AI 中,但可以预见的是,它是线性的,随着训练数据量的增加而增长。Schellaert 说,监督反馈“产生了更糟糕、更极端的效果”。

嗯,这真是太可怕了!

RAG 的限制不是(仅仅)幻觉

摩根士丹利 (Morgan Stanley) 最近关于企业采用 AI 的调查包含的前景比反对者希望每个人都相信的要好。对我来说特别突出的一点是:

但有一个被忽视的挑战 — 25% 的受访者担心声誉受损。

这正是对幻觉的担忧。它表明,任何幻觉,无论使用“利害关系”如何,都可能导致声誉受损,并引起企业的关注。

最后,Stardog 技术合作伙伴 Databricks 的首席执行官 Ali Ghodsi 表示,RAG 还因其他原因而不足——

在 RAG 中,您可以将向量数据库中的最新信息提取到 LLM 的上下文窗口中。模型实际上如何利用该上下文至关重要——令人惊讶的是,大多数模型都在努力解决这个问题。在关键任务上,几乎没有 LLM 的准确率超过 128k 个令牌的 ~50%。

我们都做 RAG,以便引导 LLM 走向真相,但 LLM 并不总是很容易驾驭。也许我们可以在神经网络架构级别解决这个问题;也许不是。我不知道。

考虑一个思想实验

有没有办法非破坏性地摧毁两家知识经济公司——比如说两家银行?也就是说,不伤害任何人,不破坏任何不动产,甚至不删掉一个字节的数据?当然,这很容易。我会把银行 B 的所有数据都给银行 A,反之亦然。没有数据被破坏,没有人员受到伤害,也没有不动产被改变。然而,两家公司都无法运作。

这种对企业知识的绝对依赖表明,知识公司的基本职能之一是保护其独特的知识资产。

然而,没有一个基础的外部 LLM 对这些独特的馆藏一无所知。解决这一差距是 Stardog Platform 融合 LLM 和 Knowledge Graphs 的原因 。融合这两种技术的其他好处是令人愉快的奖励。

LLM 的长上下文 RAG 性能,来源:Databricks

Stardog 融合 LLMs 和知识图谱

稍后我将讨论如何融合 KG 和 LLM。在这里,我说为什么它们应该融合。

逻辑是这样的:

  1. 在知识经济中,公司核心资产或多或少就是它的数据。

  2. 基础 LLM 对公司内部的数据一无所知。这是个问题。

  3. 将 LLM 应用于其独特数据持有的公司可以通过加速采用并提高 AI 驱动结果的准确性和召回率,从而获得超越竞争对手的巨大优势。

  4. LLM-知识图谱融合平台是理想的 LLM-知识适配器,可实现从数据中创建知识和意义所带来的战略优势。

为什么企业级GenAI需要融合KG

LLM 非常适合背景知识(“每个人都知道或应该知道的”),但它们对企业知识的影响很大。可以说,在知识经济中,证明公司存在权利的原因是它所负责的独特数据领域。

正如我们将在下面看到的,您可以使用知识图谱来执行 RAG。但您不必只做 RAG。还有有其他选择。在过去的一年里,我们一直在研究 Stardog Voicebox, Stardog Voicebox智能体: 知识图谱&LLM双轮驱动、释放自动化的创造力 这是一款无幻觉的快速 AI 数据助手。我们正在生命科学、银行、制造商和国家安全组织(包括现有客户和新客户)试用 Voicebox。

对于任务关键型数据洞察,通过 Voicebox 的对话式 AI 完全民主化,我们将洞察建立在企业数据中,100% 无幻觉,是城里唯一的游戏。

例如,在一家面临严重监管和数据访问挑战的美国大型银行,他们给了我们一份分析问题清单,这些问题他们无法在一个持续 18 个月的内部项目中使用 GenAI 实现民主化。我们解决了这一挑战,并让他们在 2 天内获得大众化的见解。这不是 RAG 与 GraphRAG 的问题; 而是语义解析(即 Voicebox 处理 GenAI 和用户输入的方式)与 RAG 的任何变体(包括 Graph RAG)相比。

但是,如果你只从这篇文章中吸取了一个教训,那就是:一个可以做简单事情 (RAG)、中等事情 (GraphRAG) 和困难事情 (无幻觉语义解析) 的单一平台就是你想要的,因为你不需要多个平台。Stardog是可以同时完成这三项任务的单一平台。

但 Stardog 不仅仅是 Voicebox。在这篇博文的其余部分,我将介绍 Stardog 的另一部分,即 Enterprise GenAI 的知识图谱和 LLM 的平台融合。

企业对 GenAI 平台的需求

客户需要帮助构建可重用、可靠且可持续的模块化 GenAI 堆栈;可重复使用和可重复;将机器学习、深度学习、GenAI 任务解耦,但以高质量数据为基础;这包括世系和可追溯性;这是值得信赖的。

在此 GenAI 堆栈中,客户需要灵活但基础的组件:

  • KG 可用于从孤立的数据中创建见解和连接

  • KG 可用于在数据中创造效用和价值

  • KG 可用于知识检索

  • 所有这些都是跨用例和设计模式创建一次、多次使用。


简而言之,我们在 Stardog 中提供的 Fusion Platform 看起来很像 Gartner 的 Knowledge-Enabled AI 架构:

企业 GenAI 平台要完成的工作

Stardog GenAI 平台独特地融合了 LLM 和知识图谱,是满足六个 GenAI 应用程序核心需求的理想解决方案。

1. 以编程方式、从纯文本提示或 API 查询所有企业数据。

“知识图谱”有很多定义,但我更喜欢我在 2017 年创造的定义——

关于 X 的知识图谱是一个软件平台,可以回答关于 X 的任何问题,因为它知道关于 X 值得了解的一切。

换句话说,知识图谱是数据集成机制,旨在实现全面性,同时又能容忍不完整性。企业知识图谱在企业数据孤岛方面的全面性是其为 GenAI 应用程序增加价值的关键,包括通过对企业知识图谱的编程查询,关键是 LLM 与企业知识进行水合。

2. 将 LLM 输出扎根于现实中,即在您的企业数据中。

RAG 的主要问题是它允许说谎者最后发言:如果你必须允许说谎者说话,你永远不应该让说谎者说最后的话。RAG 本质上让 LLM 最后(对用户)说话,这是它最大的缺陷。改善这一缺陷的一种方法是将 LLM 所说的建立在现实中,即企业知识中。接地就像一块海绵或过滤器,可以过滤 LLM 产生的幻觉。

但 RAG 的另一个缺陷是它是一个花哨的搜索引擎,这只是说 RAG 的数据范围仅限于企业文档。

RAG 只理解企业文档。这是一项真正的技术突破,但在企业中还不够。企业(至少)有两个知识来源——

  1. 驻留在数据库记录中的知识 — RAG 对这些知识视而不见。

  2. 驻留在企业文档中的知识 — RAG 仅在此处可见。


LLM 不理解这两种知识驻留之间的区别,这意味着 LLM 会对事实或知识产生幻觉,这些事实或知识的规范来源在企业中是某些数据库或文档,同样频繁。因此,为了有效地将 LLM 输出置于企业知识中,知识图谱必须包含来自这两个住所的知识。我们称之为通过扩展 AI 的数据范围来扩展 AI 安全性。有关 Stardog Fusion Platform 如何执行此操作的更多详细信息,请参阅安全 RAG。

3. 用知识图谱指导 RAG——安全RAG。

企业中 RAG 的最新技术是在 LLM 的帮助下从完全基于的知识图谱中检索。如果你要做错事 (RAG),你应该以正确的方式做 (GraphRAG)。这有点夸张,但它提出了一个关键点,即普通的旧 RAG 甚至不再真正理智了。在那里,我说了。朋友们不会让朋友在 2024 年底做普通的老式 RAG。

随着我们构建 Stardog 的 LLM 支持的知识图谱完成能力(有关更多信息,请参阅下面的 #4),这需要我们在 Stardog Platform 中为 RAG 添加更多基础设施支持,因为我们的命名实体、事件和关系提取方法,以使用文档驻留知识自动完成知识图谱,包括提取和中间块检索的交互式过程。我想,具有讽刺意味的是,在一个过程中进行 RAG,其目的是避免不得不进行 RAG,但计算机科学中经常发生更奇怪的事情。(例如,为了避免教人们 C,我们构建了 Python,这意味着用 C 语言进行了大量的软件工程。

但是,正如我们将在下面的指导 GenAI 基础设施投资的决策树中看到的那样,在一些用例中,普通的旧 RAG 是可以接受的,而 Stardog Fusion Platform 支持这些用例,对于对幻觉敏感度为中等或高的用例,可以直接直接迁移到 Graph RAG 和安全 RAG。

4. 使用 LLM 通过企业文档的信息提取知识图谱

传统上,从非结构化文本中提取信息(以语义上将其常驻知识提升为知识图谱)由 GNN 或类似的神经网络架构提供支持。大多数最先进的结果仍然使用某种 GNN 报告;但问题是 GNN 通常不能很好地推广到分布外的输入。虽然与 GNN 相比,LLM 通常不会获得严格的最新结果,但它们通常可以更好地泛化并且不需要特定的培训工作。我们看到 Stardog 中至少有两种用途 LLM 通过从企业文档中获取知识来完成知识图谱 —

  • 当幻觉不可接受时的安全 RAG(即针对完整知识的语义解析)

  • 对于幻觉敏感性较低(即某些幻觉是可以接受的)和文档在数据分发中占主导地位的使用案例,请用GraphRAG,因为文档是 RAG 可以处理的所有问题。

5. 以编程方式构建重要事物。

  • 用 LLM 构建知识图谱;请参阅上面的 #4,因为在基本情况下,通过信息提取从头开始引导 KG 是完成现有知识图谱的一种变体,该知识图谱已经包含来自结构化数据源的实体和关系。

  • 使用 LLM 构建本体 — 知识图谱的数据模型。我们正在使用 LLM 来自动创建很多东西,因为生命太短暂了,不能要求每个主题专家也都成为知识工程师。


因此,我们教 LLM 从简单的语言提示中创建本体。这比用文字描述更容易向您展示。看啊,Stardog Designer 的盒子本体论者。

我们现在提供的此功能也将在接下来的几个版本中推广到包括相邻的功能,例如:

  • 通过在后台异步运行 Designer 来丰富现有本体,以提供建模建议,例如新的归纳关系、新的节点分类和谓词类型以及脱节公理。我们已经教 LLM 使用 Designer 作为工具,这意味着所有这些的结果最终都会排队到 Designer 中供人们接受,然后再将更改应用于真正的本体。从技术上讲,这使得它成为半监督自动化,我们认为出于多种用户体验原因,这是正确的方法。在接下来的几个季度里,我们将把 Voicebox Designer 集成从本体创建和维护扩展到其他功能,包括 Stardog 规则创建和维护以及 SHACL 数据质量约束。


这里的目标是自动化知识工程学科,以便领域专家和 Stardog Voicebox 知识工程师,能够根据他们的领域专业知识(因此是 SME)创建和维护企业知识图谱,并通过通俗易懂的语言 UX 使用 Stardog Voicebox。

  • 使用 LLM 构建虚拟图映射 — 查询时孤岛统一。一段时间以来,我一直在建议 VG 映射,结果还算不错;但是,LLM 在理解稀疏上下文方面具有一些独特的能力,我们一直在投入更多时间来提高自动映射的质量(就 F1 而言)。

  • 微调 — 有经验证据表明,使用特定于领域的本体(Designer 现在半自动化的那种)作为 LLM 的 PEFT 输入可以提高准确性并降低幻觉频率。我们正在为居住在 Stardog 中的客户数据(包括通过我们的联合 VG 功能实现的“虚拟生活”)使用 Customer Ontos 的其他输入进行自动化 PEFT:


6. 守卫 — 通过 LLM 和 KG 进行生成后幻觉检测。

简而言之,像 Stardog KG-LLM 这样的 Fusion Platform 查询、奠定、指导、构建、完成和丰富 LLM、其输出和知识图谱本身。Stardog 是 GenAI 的一个良性循环。

同样,Gartner 从方向上确定了这一点;虽然我不一定同意这里的一些细节,但这不是关于细节,而是关于大局对齐。

我们还在研究一些更遥远的功能,我现在不打算谈论,只是想说,围绕 LLM 世界模型、符号知识蒸馏和知识图谱本体的自动化,存在着非常有趣的商业价值碰撞。敬请期待。

Gartner 正在聚合需求

Gartner 做得完全正确。这是您可能见过的图片。我❤️这张图片。

GenAI 基础设施投资决策树

幻觉敏感性 相关的、可寻址的数据 其他约束
Plain Ol’ RAG 无到低 仅限商业文件;没有结构化数据。 减少幻觉,但不能消除幻觉;不适用于受监管行业的高风险使用案例。
Generic Graph RAG
可以考虑结构化数据,但不能原则性地统一整个企业的结构化、半结构化和非结构化数据源。
Salesforce Einstein 仅限 Salesforce 应用程序驻留数据 不支持推动业务价值的数据路径问题。
Microsoft Copilot Microsoft Office 数据加上 Microsoft 的基本业务工件:Word、Excel 等。 无权访问位于 Microsoft 世界之外的数据,包括本地和其他专有数据。

OpenAI ChatGPT

背景知识;即,“每个人都应该了解的关于世界的信息” 至关重要的是,ChatGPT 对企业知识一无所知。
Databricks TAG 低到中 关系数据(常规、非稀疏、非高度连接) 无法支持推动业务价值的数据路径问题。
Stardog Voicebox
从低到高 任何数据库、文档或 API;结构化、半结构化、非结构化数据。 请参阅 Voicebox 中的最佳位置,了解 Voicebox 何时是最佳选择。
Safety RAG 中到高 任何数据库、文档或 API;结构化、半结构化、非结构化数据。 需要非结构化提取和 KG 摄取处理;Stardog 包含该功能,但其他图形系统没有。
Stardog Fusion 平台 从低到高 任何数据库、文档或 API;结构化、半结构化、非结构化数据。 连接数据孤岛、结构化数据源和数据库驻留知识

知识图谱和 RAG — 分享 Accenture 的学习成果

埃森哲全球数据和人工智能负责人Teresa Tung分享了埃森哲关于将LLM和知识图谱融合在一个平台上的重要性的观点。

埃森哲对 Stardog 作为领先的企业知识图谱平台进行战略投资,使组织能够在这个生成式人工智能时代利用其数据做更多的事情,并从中获得更大的价值。

Accenture Invests in Stardog to Help Companies Optimize their Data Insights and Value

https://newsroom.accenture.com/news/2023/accenture-invests-in-stardog-to-help-companies-optimize-their-data-insights-and-value

在 2024 年埃森哲对 2000 名 CxO 的调查中,65% 的受访者表示,构建端到端数据基础是扩展生成式 AI 的最大障碍之一。这种端到端数据基础通过管理整个数据生命周期(从初始收集到使用后管理)来打破孤岛并提供高质量数据。

知识图谱能够使现实世界的上下文易于机器理解,公司使用它来促进更好的企业数据集成和统一。数据不是通过组合表来集成数据,而是使用知识图谱无休止地链接概念的能力来统一数据,而无需更改底层数据。这种统一数据的能力有助于连接数据孤岛,并在整个企业中产生灵活的数据层,这是为 GenAI 企业洞察引擎采购数据作为燃料的关键!

生成式 AI 和 LLM 需要与知识图谱配合使用,以便在回答问题时具有相关性,以提取与用户领域和数据相关的信息。此功能使希望以自己的方式探索数据的用户受益,同时还使企业工程团队能够高效、有意义地从文档中提取结构化数据。

我们发现,知识图谱是使 RAG 和 LLM 代理快速交付具有战略相关性的价值的主要设计模式。Stardog 将知识图谱和 LLM 融合在一起,是一个领先的解决方案,我们很高兴能与之合作。

结束语

Stardog Fusion Platform 结合了知识图谱 LLM 的精华,并且至关重要的是,它开辟了将 KG 和 LLM 功能融合成一个连贯整体的前进道路。

让我们回到我在 2017 年写的一篇文章:

关于 X 的知识图谱是一个软件平台,可以回答关于 X 的任何问题,因为它知道值得了解的关于 X 的一切。

我喜欢这个定义,因为它触及了企业知识图谱的两个最重要的特征:

  1. 它的主要功能是回答有关某个域的问题。

  2. 它通过以丰富的、上下文化的语义方式连接数据来回答问题,这算作“了解”该领域,而不仅仅是存储原始数据或生成关于它的下一个最可能的令牌。


当涉及到企业中的 AI 时,安全性和准确性是完整性(所有正确答案)和健全性(只有正确答案,即没有错误答案)的函数。但这正是企业 AI 的理想数据策略的功能。双赢!

为什么关于 LLM 和 Knowledge Graph 的嗡嗡声如此之大?我们为什么要构建这个 Fusion 平台?这归结为四大因素——

  1. 企业 AI 必须以您的企业私有数据为基础

  2. 只有Grounded LLM 输出是安全的

  3. 知识图谱统一了文档和数据库,这是 RAG 单独无法做到的; 但是,如果您要做 RAG,请使用 Knowledge RAG 正确地做

  4. 按需提供及时、准确的洞察是企业 GenAI 的最大优势

如果您想在企业中利用 GenAI 取胜,您必须了解客户的需求和使用案例。在受监管的行业和高风险使用案例中,例如金融服务中的欺诈、合规性和风险;为现代作战人员提供决策优势;或者帮助制药和制造商端到端管理全球供应链 - 您需要安全、无幻觉的见解,这些见解植根于企业数据源,并且始终及时、准确且值得信赖 。您还需要全面的答案和见解,因此您不能选择只能处理文档和非结构化数据的平台和解决方案。

在企业中利用 AI 取胜的唯一方法是拥有正确的数据策略,而 AI 数据策略的关键是部署一个提供最佳 LLM 和知识图谱的平台。







请到「今天看啥」查看全文