摘要
本文介绍了人机协同的混合知识图谱(KG)-大型语言模型(LLM)的双轮驱动癌症诊疗护理智能体,其中应用了最新的结直肠癌医学知识。目前正在莫菲特癌症中心进行评估,该中心是美国和世界顶尖的癌症中心之一,以协助进行医学研究和临床信息检索任务。我们的智能体之所以卓越,是因为它比单独的大型语言模型、知识图谱或搜索引擎更能满足用户需求。众所周知,大型语言模型会出现幻觉和灾难性遗忘,并且是在过时的语料库上进行训练的。最先进的知识图谱,如PrimeKG、cBioPortal、ChEMBL、NCBI等,需要手动更新,因此很快就过时了。CancerKG是无监督的,能够自动摄取并组织最新的医学知识发现。为了减轻大型语言模型的缺陷,经过验证的知识图谱增强检索增强生成(GraphRAG)。CancerKG展示了5种不同的先进用户界面,每一种都针对不同的数据形式进行了优化,并更加方便用户使用。
http://cancerkg.org/
核心速览
研究背景
-
研究问题
:这篇文章要解决的问题是如何有效地组织和检索最新的同行评审医学知识,以帮助癌症治疗和护理。现有的知识图谱(KG)和大型语言模型(LLM)存在各自的局限性,如更新不及时、缺乏可验证性和多模态内容兼容性差。
-
研究难点
:该问题的研究难点包括:快速访问最新的个性化最佳实践和其他最新医学发现;解决LLM的幻觉和灾难性遗忘问题;手动维护的知识图谱难以保持实时性和广泛覆盖。
-
相关工作
:该问题的研究相关工作包括PrimeKG、cBioPortal、ChEMBL、NCBI等传统的知识图谱,以及COVIDScholar、Sinequa等信息检索系统。这些系统虽然在某些方面有所突破,但在处理复杂的多模态医学知识和实时更新方面仍存在不足。
研究方法
这篇论文提出了一个基于检索增强生成(RAG)的混合知识图谱(KG)-大型语言模型(LLM)系统,用于解决癌症治疗和护理中的知识获取和组织问题。具体来说,
-
知识图谱(KG)初始化
:首先,利用数据科学家手动初始化的一个小规模验证过的KG作为种子,逐步扩展到包含超过250万篇最新的癌症相关同行评审出版物。KG存储在可扩展的三元组存储系统中,如Amazon Neptune或MongoDB。
-
深度学习模型
:使用GRU模型进行表格主题分类。预处理阶段包括数据清理和数值数据的编码。然后将预处理后的特征向量用于微调BioBERT嵌入,并通过GRU层生成上下文化向量。最后,通过一个密集层和二分类器进行分类。
-
知识图谱的丰富和融合
:从提取的信息中分类和提取突出主题的簇,并使用高级AI模型进行准确的聚类。融合过程包括将提取的分层知识匹配到KG中的相应节点,并根据置信度评分进行自动校正。
-
交互式界面
:提供交互式KG、出版物和表格结构搜索引擎、自然语言对话界面和3D元概况界面,以便用户更方便地访问和查询相关知识。
实验设计
-
数据收集
:从PubMed.com中提取最新的癌症相关同行评审出版物,并将其解析、分解、分类和持续更新。
-
样本选择
:从Web规模的标注数据集(如WDC和CancerKG)中构建训练集。对于每个主题,选择一个代表性的表格作为种子,并使用该种子训练GRU二分类模型,创建相应的簇。
-
参数配置
:使用100,000维的特征空间,包括从数据集中选择的100K个英语词汇。数值数据通过正则表达式进行编码。训练和验证在包含4台机器的集群上进行,使用Amazon P5 AWS实例进行LLM微调。
结果与分析
-
分类准确率
:使用深度学习的Bi-GRU模型在验证集上的F-measure约为95%,表明模型在分类任务上表现良好。
-
知识图谱更新
:KG能够自动从最新的同行评审出版物中摄取和组织知识,确保知识的可靠性和时效性。
-
用户界面效果
:交互式KG、搜索引擎和自然语言对话界面得到了用户的积极反馈,显著提高了用户访问和查询最新医学知识的速度和效率。
总体结论
这篇论文介绍了CancerKG,第一个交互式、可验证、可扩展的知识图谱/大型语言模型(LLM)RAG混合系统,专门用于结直肠癌。通过从PubMed.com中自动摄取和更新最新的同行评审医学知识,CancerKG解决了现有知识图谱和LLM在更新速度、可验证性和多模态内容兼容性方面的不足。该系统提供了多种高级用户界面,显著提高了用户访问和查询最新医学知识的效率和便捷性。尽管本文以结直肠癌为模型领域,但该架构不依赖于特定领域,因此具有广泛的应用潜力。
论文评价
优点与创新
-
Web-scale Hybrid Knowledge Graph (KG)-Large Language Model (LLM)
: CancerKG 是第一个结合大规模知识图谱和大型语言模型的混合系统,旨在快速访问最新的个性化最佳实践和最新的医学知识发现。
-
RAG-based System
: 该系统基于检索增强生成(RAG)框架,结合了LLM的可解释性和知识图谱的多模态内容兼容性。
-
自动知识摄取和组织
: CancerKG 能够自动从PubMed中摄取和组织的最新医学发现,无需大量人工监督。
-
多种用户界面
: 系统提供了五种不同的高级用户界面,每种界面都针对不同的数据模式进行了优化,使用户更方便地访问信息。
-
无监督学习
: CancerKG 通过从最新的同行评审出版物中学习,展示了广泛的领域覆盖和主题深度。
-
结构信息检索
: 系统支持对复杂表格的结构化信息检索,这在现有解决方案中是前所未有的。
-
可扩展性
: CancerKG 能够扩展到数千个数据源,理解多模态知识,不产生幻觉,不需要大量监督。
-
验证的知识图谱
: 作为RAG的守卫,验证的知识图谱确保了信息的可靠性和最新性。
不足与反思
-
依赖特定领域
: 尽管CancerKG以结直肠癌为模型领域,但其架构并不依赖于该领域,理论上适用于其他科学和医学领域。然而,实际应用中可能需要针对不同领域进行重新训练。
-
初始融合错误的自动纠正
: 提取的分层知识在初始融合过程中可能会出现错误,尽管这些错误可以通过专家评估来识别和纠正,但长期目标是让融合模型自动学习和纠正这些错误。
-
数据稀疏性
: 在某些情况下,提取的数据可能非常稀疏,这可能会影响模型的性能和准确性。
-
长尾效应
: 尽管系统能够处理大量的数据,但对于某些罕见或新出现的话题,可能仍然存在覆盖不足的问题。
关键问题及回答
问题1:CancerKG.ORG架构中使用了哪些深度学习模型,它们各自的作用是什么?
-
GRU模型
:用于表格主题分类。输入是表格的预处理表示,经过GRU层和原始嵌入的串联,形成丰富的上下文化向量。最后,通过一个包含32个单元的密集层、批量归一化层、dropout层和二进制分类器进行分类。
-
Bi-GRU模型
:用于分类表格的元数据(如水平元数据VMH和垂直元数据VMD),形成丰富的上下文化向量。
这些模型共同作用,帮助CancerKG从大量的医学文献中提取和分类知识,并将其组织成一个结构化的知识库。
问题2:CancerKG如何确保知识库的实时性和准确性?
-
自动更新
:CancerKG的知识库从PubMed.com自动获取最新的同行评审医学文献,并通过自然语言处理技术解析、分解和重组这些文献。
-
人工初始化
:知识库的结构层次由数据科学家手动初始化,确保初始结构的准确性和完整性。
-
自动丰富和融合
:使用高级AI模型对新提取的信息进行分类和聚类,并将其插入到知识库中。这个过程包括匹配和融合提取的子树和新节点,确保知识库的准确性和一致性。
-
持续验证
:通过专家评估和反馈机制,不断校正和优化知识库的内容,确保其实时性和准确性。
问题3:CancerKG的用户界面有哪些功能,它们如何帮助用户高效地获取所需信息?
-
交互式知识库
:用户可以通过点击节点浏览分层知识库,查看相关的表格和元数据。
-
出版物搜索引擎
:支持全文搜索,用户可以输入自然语言查询或选择特定的搜索字段(如标题、摘要、表格数据等),系统会返回相关的出版物和表格。
-
表格结构搜索引擎
:允许用户对表格进行结构化的搜索,支持按字段匹配和同义词替换,帮助用户快速找到所需的表格数据。
-
自然语言对话界面
:用户可以通过自然语言提问,系统会解析查询并调用相应的LLM生成回答,同时修正和补充表格数据。
-
3D元概况界面
:为用户提供表格聚类的摘要和可视化,用户可以通过选择特定的属性(如VMH和VMD)查看相关的表格子集,进一步细化查询结果。
这些用户界面和功能共同作用,帮助用户高效地浏览、搜索和提问,获取最新的医学知识和实践。
参考文献:
-
护理临床智能决策的新颖方法:大语言模型与本地知识库的整合
-
Nature - 基于护理大模型的医院门诊接待机器人和护士的人机协同新范式
-
使用大模型指导患者创建高效全面的临床护理信息
-
从“小白”到“专家”:大模型在肿瘤护理中的潜力探索
-
[最新论文]探索大模型在乳腺癌肿瘤学护理领域中的应用潜力 - 谷歌DeepMind等
-
厦门·护理信息大会|首都医科大学与柯基数据合作的NursGPT项目顺利启动!
-
DrHouse虚拟医生: 基于传感器数据和专家知识赋能的大模型医学诊疗推理系统 - 香港中文大学等