专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
数据派THU  ·  活动预告|Python科研应用分享会 ·  4 天前  
CDA数据分析师  ·  【实战】数据产品经理应该具备的5点数据分析技能 ·  6 天前  
大数据文摘  ·  三星,正在自救 ·  1 周前  
数据派THU  ·  【NeurIPS ... ·  1 周前  
51好读  ›  专栏  ›  数据派THU

Nat. Med. | 基于图神经网络的零样本药物重定位预测模型

数据派THU  · 公众号  · 大数据  · 2024-10-18 17:00

正文

来源:AdvanceBC

本文约11100字,建议阅读15+分钟
本文介绍了一种名为TxGNN的图神经网络模型。


2024年9月25日,来自Marinka Zitnik研究团队的Kexin Huang、Payal Chandak和Qianwen Wang等人在Nature Medicine期刊上发表了一篇题为A foundation model for clinician-centered drug repurposing”的研究文章。文章介绍了一种名为TxGNN的图神经网络模型,专门用于零样本药物再利用的预测,尤其针对没有现有治疗方案或治疗选项有限的疾病。研究显示,TxGNN能够通过分析大型医学知识图谱,有效地预测药物适应症与禁忌症,并提供可解释的多跳路径来揭示预测背后的医学推理。该研究不仅在8种现有方法的评估中显著提高了预测准确性,还展示了与临床医生的处方决策高度一致的药物再利用潜力,为未来的精准医疗和药物开发提供了新的技术支持。



关键字:零样本学习 | 医学知识图谱 | 模型解释


引言


药物再利用,即为已批准的药物寻找新的治疗用途,已成为近年来药物研发中的一种有效策略。通过再利用现有的药物,研究团队能够显著减少新药开发所需的时间和成本,同时利用现有药物的安全性和有效性数据,加速其进入临床阶段。然而,当前的药物再利用往往是偶然和机会驱动的,尤其是那些缺乏现有治疗方案的疾病。全球约有7,000种罕见疾病,但其中只有5-7%获得了美国食品药品监督管理局(FDA)的批准药物。这种现状凸显了开发新的治疗方案的紧迫性。


研究团队指出,现有的人工智能(AI)模型在药物再利用上的临床应用仍然有限,这些模型通常集中于已经有部分药物治疗的疾病。然而,许多罕见或复杂疾病仍然缺乏任何有效的治疗药物,因此需要更加广泛和有效的药物再利用方法。研究团队强调,药物再利用的目标不仅限于已有药物的扩展适应症,还应包括对于尚无治疗方案的疾病,特别是在理解不完全的疾病领域。


为了应对这一挑战,研究团队提出了一种名为TxGNN的图基础模型。TxGNN通过图神经网络(GNN)对大型医学知识图谱进行分析,能够实现零样本药物再利用预测。不同于传统的基于疾病特定模型的方式,TxGNN是一种经过预训练的单一模型,能够跨越多种疾病进行适应性应用。该模型在17,080种疾病和7,957种药物的知识图谱上进行训练,能够预测这些疾病与药物之间的适应症和禁忌症。


除了提升预测准确性外,研究团队还开发了一个解释模块TxGNN Explainer,该模块为TxGNN的预测结果提供了透明的多跳医学知识路径。这些路径不仅能够帮助人类专家理解预测的依据,还增强了模型的临床应用价值。研究团队在多个评估指标上测试了TxGNN的表现,并展示了其在对罕见疾病和复杂疾病的治疗预测中的优势。


研究内容


在这项研究中,研究团队提出了TxGNN,一种基于图神经网络(GNN)的零样本药物再利用预测模型,重点用于解决那些缺乏现有治疗药物的疾病问题。模型的核心是通过对一个大规模医学知识图谱(Knowledge Graph, KG)的分析,预测药物与疾病之间的潜在适应症和禁忌症。首先,研究团队构建了一个融合多种生物医学数据的医学知识图谱,该图谱包含17,080种疾病、7,957种药物以及30,675种药物禁忌症和9,388种适应症。这些数据涵盖了疾病的分子机制、药物靶点、基因-蛋白质相互作用、信号通路等信息,提供了丰富的图结构数据,节点代表生物医学概念(如疾病、药物、基因等),边则表示这些概念之间的关联关系(如适应症、禁忌症、蛋白质相互作用等)。


在TxGNN的模型架构中,首先是TxGNN预测器(TxGNN Predictor),该模块使用图神经网络来学习图谱中各节点和边的潜在表示。通过图消息传递机制,药物、疾病、基因等节点的信息能够在图中传播,并通过不断聚合邻居节点的信息更新其表示,使得这些节点的嵌入能够反映它们在图谱中的语义关系。该机制允许TxGNN通过多层消息传递和节点更新,捕捉到药物和疾病之间的复杂关系。


此外,为了应对零样本预测的挑战,研究团队引入了度量学习模块,目的是在表示空间中将相似疾病的距离拉近,而将不相关疾病的距离拉远。这一模块的加入使得TxGNN在处理那些在训练数据中没有现有药物治疗的疾病时,仍能通过相似疾病的信息进行准确的药物再利用预测。


为了确保模型的可解释性,研究团队开发了TxGNN解释器(TxGNN Explainer),该模块基于“图掩码(GraphMask)”技术,能够自动生成一个解释性子图,展示模型在做出某个预测时所依赖的关键节点和边。具体来说,当预测一个药物-疾病对时,解释器会生成一条多跳路径,展示药物与疾病之间的间接联系,这些联系可能通过共同的基因、蛋白质或生物过程形成。每一条边都被赋予一个重要性得分,表示其在预测中的贡献。通过这种解释路径,临床专家可以更好地理解模型的预测依据,增强其对模型预测的信任。


模型的训练过程采用了大规模自监督学习。在知识图谱上,研究团队使用节点分类任务进行训练,即根据图中的节点和边信息预测疾病与药物之间的适应症或禁忌症关系。为验证模型在零样本情况下的表现,研究团队通过五折交叉验证将部分疾病从训练集中移除,并专门用于测试。评估标准包括准确率、曲线下面积(AUC)、平均准确率-召回率曲线面积(AUPRC)等。


研究团队将TxGNN与现有的八种药物再利用方法进行了比较,涵盖了网络医学中的统计方法和基于图神经网络的最新方法,例如KL散度、JS散度、图理论网络接近性、RGCN、HGT、HAN以及自然语言处理模型BioBERT。在多种基准测试中,TxGNN在药物适应症和禁忌症的预测中表现出了显著的性能优势。


为了进一步评估TxGNN解释模块的实际应用效果,研究团队设计了一项涉及临床医生、研究人员和药剂师的专家评估实验。通过让这些专家评估TxGNN的预测结果及其解释路径,研究团队记录了专家的预测准确率、信心评分和思考时间,以验证解释模块是否对提高预测结果的信任度有所帮助。


研究结果


TxGNN零样本药物再利用模型概述


零样本药物再利用涉及预测针对治疗选择有限或没有治疗方案的疾病的治疗候选药物(图1b)。在数学上,该模型输入一个查询的药物-疾病对,并输出该药物作用于该疾病的可能性。用于评估此类模型的金标准标签来自研究团队之前整理的医学知识图谱(KG)(图1d),该图谱包含9,388个适应症和30,675个禁忌症。该医学知识图谱覆盖17,080种疾病,其中92%缺乏FDA批准的药物,涵盖了稀有和不太了解的复杂疾病。知识图谱还包括7,957个潜在的药物再利用候选药物,涵盖了FDA批准的药物和正在进行临床试验的实验性药物。


研究团队的零样本药物再利用模型TxGNN基于有效药物直接靶向疾病扰动网络或间接通过疾病相关网络传播治疗效果的原理。TxGNN有两个模块:TxGNN预测模块预测药物的适应症和禁忌症,而TxGNN解释模块找到可解释的多跳知识路径,将查询的药物与查询的疾病连接起来(图1c)。


图1:TxGNN是用于药物再利用的图基础模型,为治疗选择有限的疾病识别候选药物


TxGNN预测模块由一个针对医学知识图谱中关系优化的图神经网络(GNN)组成。通过大规模的自监督预训练,GNN为知识图谱中的所有概念生成有意义的表示。预训练模型经过微调,适应处理治疗任务,预测药物在多种疾病中的候选适应症和禁忌症,无需或仅需对模型进行最小的额外训练。TxGNN利用额外的度量学习组件进行零样本预测,利用了疾病可以共享疾病相关遗传和基因组网络的见解,从而使模型能够将已标注疾病的医学知识转移到其他疾病,以增强对治疗选择有限疾病的预测(图2a)。这一过程通过基于每个疾病概念的邻居和知识图谱中局部疾病相关网络的拓扑结构创建疾病特征向量来实现。疾病之间的相似性通过其特征向量的标准化点积来衡量。由于大多数疾病不共享潜在病理,因此它们的相似性评分较低。相反,较高的疾病相似性评分则表明类似的疾病机制(图2b)。


在查询特定疾病时,TxGNN检索相似疾病,为它们生成嵌入并根据与查询疾病的相似性自适应地聚合这些嵌入。聚合的输出嵌入总结了从相似疾病融合的知识,与查询疾病的嵌入结合。这一步骤可以解释为几何机器学习文献中的图重构技术。TxGNN以统一的方式处理不同的治疗任务,例如适应症和禁忌症预测,利用来自知识图谱统一潜在空间的药物和疾病表示。给定一个查询疾病,TxGNN根据其预测的可能性评分对药物进行排名,提供优先级列表的药物再利用候选者。


尽管TxGNN预测器为药物再利用候选者提供了可能性评分,但这不足以确保模型的可靠使用。人类专家希望理解这些预测背后的推理,以验证模型的假设并更好地理解候选治疗机制。为此,TxGNN解释器解析知识图谱,以提取和简明地表示相关医学知识。TxGNN采用了一种自解释的方法,称为GraphMask。GraphMask生成一个稀疏但足够的医学概念子图,认为这些概念对于TxGNN的预测至关重要。TxGNN为医学知识图谱中的每条边生成0到1之间的重要性评分。它通过形成TxGNN预测推理的多跳路径,将药物与疾病联系起来,1表示该边对预测至关重要,0表示该边无关紧要。TxGNN解释器结合药物-疾病子图和边的重要性评分,生成将疾病与预测药物关联的可解释的多跳推理。TxGNN解释器提供细致的解释,正如研究团队在一项人类评估研究中所示,这些解释与人类专家的直觉一致。


研究团队开发了一个以人为本的工具,结合TxGNN的预测和多跳可解释路径。在一系列设计中,研究团队专注于基于路径的推理,因为人类评估研究表明这一设计选择增强了临床医生的理解和满意度。


图2:TxGNN准确预测药物的适应症和禁忌症


治疗匹配与零样本药物再利用


研究团队在多个保留数据集上评估了药物再利用模型的性能。他们通过从知识图谱中抽样疾病生成了一个保留数据集。这些疾病在训练阶段故意被排除,后来作为测试案例来评估模型将其洞察推广到之前未见过的疾病的能力。这些被保留的疾病是随机选择的,遵循标准评估策略,或特意选择以评估零样本预测。在这项研究中,研究团队使用了这两个保留数据集来评估方法。研究团队将TxGNN与八种方法进行了比较,以预测治疗用途。这些方法包括网络医学统计技术,如Kullback–Leibler(KL)和Jensen–Shannon(JS)散度、图论网络接近性方法、扩散状态距离(DSD)、先进的图神经网络方法,包括关系图卷积网络(RGCN)、异构图变换器(HGT)和异构注意力网络(HAN),以及自然语言处理模型BioBERT。


研究团队首先实施了一种用于评估药物再利用人工智能模型的标准基准策略,其中药物-疾病治疗对被随机打乱,并将这些对的一部分留作保留集(测试集;图2c)。在这种策略下,评估为保留的疾病在训练数据集中有一些药物适应症和禁忌症。因此,推广目标是为已有某些药物的疾病识别治疗候选者。这种评估方法与文献中主要使用的方法一致。研究团队使用精确率-召回曲线下的面积(AUPRC)作为评估指标,因为它测量模型在不同阈值下的召回和精确率权衡。在这种情况下的实验结果表明,八种现有方法中有三种达到了AUPRC > 0.80,而HAN以0.873的AUPRC表现最佳。TxGNN的表现与这些成熟的方法相似。在适应症预测方面,TxGNN较HAN的AUPRC提高了4.3%(0.913)。


这些结果表明,机器学习模型能够为已有某些FDA批准药物的疾病识别额外的候选药物。然而,Duran等认为,这些模型通过从数据集中检索与现有治疗相似的药物来为某种疾病做出预测。这表明标准评估策略不适用于评估没有FDA批准药物的疾病(图1b)。考虑到这一局限性,研究团队在零样本药物再利用下对模型进行了考虑。他们首先保留了一组随机选择的疾病,然后将所有相关药物移入保留集(图2d)。从生物学角度看,模型需要为缺乏治疗的疾病预测治疗候选者,这意味着它必须在没有药物相似性可用数据的情况下进行操作。在这种情况下,TxGNN的表现远超所有现有方法。TxGNN在适应症预测方面显著优于下一个最佳方法(AUPRC提升19.0%),在禁忌症预测方面(AUPRC提升23.9%)。尽管已有方法在常规药物再利用评估中取得了令人满意的结果,但在具有挑战性的场景中往往表现不佳。TxGNN是唯一在所有场景中都保持一致性能的方法。


跨疾病领域的零样本药物再利用评估


具有共享机制的疾病也可以共享有效药物。例如,选择性血清素再摄取抑制剂(SSRIs)可以治疗多种精神疾病,包括重度抑郁症、焦虑症和强迫症。如果在训练期间,模型了解到某种SSRI适用于重度抑郁症,那么在测试期间推测同样的SSRI可能对强迫症有效并不是一个大 leap。这种现象被称为“捷径学习”,并且是许多深度学习失败的根源。捷径决策规则通常在标准基准测试中表现良好,但在具有挑战性的条件下(如为没有治疗选择的稀有疾病或具有不同疾病机制的复杂疾病亚型预测药物)往往失败。


为了评估针对这些具有挑战性疾病的药物再利用模型,研究团队整理了一个严格的保留数据集,该数据集包含一组生物相关的疾病,称为“疾病领域”。对于每个疾病领域,所有药物适应症和禁忌症均从训练数据集中移除,同时去除部分药物与知识图谱中其他医学概念的关系。该数据集划分用于评估模型在缺乏分子数据和现有药物的疾病上的表现(图3a)。在这一设置下,保留评估集中的疾病比训练集中的疾病邻居少得多。在这项研究中,研究团队考虑了九个多样的疾病领域保留数据集,并按疾病领域大小递增列出:(1) 与糖尿病相关的疾病,如妊娠糖尿病和脂肪萎缩性糖尿病;(2) “肾上腺”疾病,包括阿迪森氏病和异位库欣综合症;(3) “自身免疫”疾病,包括乳糜泻和格雷夫斯病;(4) “贫血”,包括地中海贫血和血红蛋白C病;(5) “神经退行性”疾病,包括皮克病和神经铁蛋白病;(6) “心理健康”障碍,包括神经性厌食症和抑郁症;(7) “代谢”疾病,包括巨球蛋白血症和吉尔伯特综合症;(8) “心血管”疾病,包括长QT综合症和二尖瓣狭窄;(9) “癌症”疾病,包括神经纤维瘤和Leydig细胞肿瘤。


研究团队在严格的保留数据集上对TxGNN进行了基准测试(图3b–f),发现其在现有方法上有一致的改善。TxGNN在9个疾病领域的适应症预测中获得了0.5–59.3%的相对AUPRC提升(平均25.72%),在禁忌症预测中则为11.8–35.6%(平均18.67%)。在九个疾病领域中,BioBERT在七个领域的适应症预测中表现最佳,而RGCN在九个领域的禁忌症中则是最佳基线。然而,TxGNN在所有九个疾病领域的两个任务中均优于所有方法,展示了其在零样本药物再利用中的广泛泛化能力和准确性。


TxGNN预测器潜在表示的可视化显示,它能够将知识从无关疾病转移到数据有限的疾病。评估指标包括AUROC和召回率。消融分析确认了TxGNN预测器的每个组件对其性能的必要性。在附加数据划分、与知识图谱的最小疾病连接、屏蔽的局部邻域和各种知识图谱配置下的压力测试显示,TxGNN保持了强大的预测性能。


图3:TxGNN在小分子数据的挑战性疾病领域预测药物适应症和禁忌症


TxGNN的解释反映模型的预测推理


TxGNN提取多跳可解释路径,这些路径是知识图谱中医学概念之间的关联序列,建立了预测药物与预测疾病之间的联系,以支持TxGNN的预测。该工具孤立出最大限度预测的子图,通过多个跳跃将查询的药物与查询的疾病连接,遵循知识图谱中的关系。这些子图的性能几乎等同于整个知识图谱。关注最具预测性的关系(即重要性评分 >0.5,代表知识图谱中边的平均14.9%),模型的性能略微下降,从AUPRC=0.890(标准差0.006)降至AUPRC=0.886(标准差0.005),表明TxGNN的解释器有效识别了关键关联,解释准确反映了TxGNN的内部推理。相反,当排除TxGNN认为具有预测性的边,并考虑剩余的无关关系(即重要性评分 <0.5,平均占边的85.1%)时,预测性能从AUPRC=0.890(标准差0.006)下降至AUPRC=0.628(标准差0.026)。


为了评估TxGNN解释的质量,研究团队使用了三个已建立的指标:插入,衡量仅使用由解释权重排名最高的前K%边的预测性能;删除,评估在去除被认为最具可解释性的前K%边后的性能;稳定性,评估在对知识图谱引入随机扰动之前和之后解释权重的一致性,通过Pearson相关性进行评估。此外,研究团队还尝试了三种图解释方法:GNNExplainer、集成梯度和信息瓶颈。排名最高的可解释边至关重要,在从图中移除或插入时都会影响性能。无论插入和删除的百分比如何,性能保持一致。此外,TxGNN解释器在不同程度的知识图谱扰动下显示出最稳定的解释权重。这些分析证实了TxGNN的多跳可解释路径捕获了进行准确预测所需的知识图谱中最关键的元素。


以人为本的TxGNN药物候选者评估


为了检验TxGNN多跳可解释路径在专家评估中的实用性,研究团队与临床医生和科学家进行了初步的人体研究。研究参与者包括五位临床医生、五位临床研究者和两位药剂师(七名男性和五名女性专家,平均年龄34.3岁;图4c)。在评估药物-疾病适应症预测时,这些参与者被要求评估TxGNN的16个预测,其中12个是准确的。研究团队记录了参与者的评估准确率、探索时间和每个预测的信心评分,共计192次试验。用户研究平均耗时约65分钟,包括评估TxGNN的药物-疾病适应症预测、可用性问卷和半结构化访谈。


在评估药物再利用候选者时,参与者报告了准确率显著提高(+46%,P=0.0443)和信心增加(+49%,P=0.0041),当预测附带解释时。参与者花费了更多时间思考(P=0.0014),将TxGNN的解释与他们的领域专业知识相结合,从而导致更有信心的决策(信心+49%,P=0.0041)。


在任务后的问卷和访谈中,参与者表示与基线相比,使用TxGNN解释器时的满意度更高(图4e),其中12名参与者中的11名(91.6%)同意或强烈同意TxGNN提供的预测和解释是有价值的。相比之下,在没有解释的情况下,12名参与者中有8名(66.7%)不同意或强烈不同意依赖TxGNN的预测。参与者在包括TxGNN解释器时,对TxGNN作出的正确预测表现出显著更高的信心(t(11)=3.64,P<0.01,使用双侧Tukey的诚实显著差异(HSD)测试)。一些参与者表示,多跳可解释的解释在检查TxGNN解释器识别的分子靶点相互作用和指导潜在不良药物事件的评估时非常有帮助。


图4:TxGNN解释器中多跳可解释路径的开发、可视化和评估


将TxGNN的预测理由与医学证据对齐


研究团队检查了预测的药物及其多跳解释是否与三种罕见疾病的医学推理一致。评估协议分为三个阶段(图5a)。最初,一位人类专家查询了TxGNN预测器,以识别可能可再利用的药物针对特定疾病。TxGNN预测器提供了一种候选药物,说明了预测的信心及其与其他候选药物的比较排名。随后,查询了TxGNN解释器,以阐明为何选择该药物进行再利用。该模型通过多跳可解释路径揭示了其推理,通过中间生物相互作用将疾病与药物联系起来。在最后阶段,收集并分析独立的医学证据,以验证模型的预测和解释。


首先,研究团队检查了TxGNN对Kleefstra综合症的预测,这是一种由EHMT1基因突变引起的罕见疾病。该疾病导致语言延迟、自闭症谱系障碍和儿童低肌张力,通常表现为大脑发育不良,神经通路沉睡。查询TxGNN预测器后,推荐了佐匹克隆作为首选药物再利用候选(图5b)。最初,佐匹克隆由于其对γ-氨基丁酸(GABA)A受体的镇静效应,似乎对大脑发育不良的问题有潜在风险(GABRG2基因)。然而,TxGNN解释器表明,佐匹克隆对GABRG2的作用可能降低自闭症易感性并改善前额叶皮层功能。令人惊讶的是,佐匹克隆在神经疾病中显示出刺激性作用,暂时唤醒低活跃的神经元,这暗示了其在神经发育障碍中的潜在治疗用途。这种矛盾的改善可以增强重度脑损伤或神经发育障碍个体的语言、运动技能和警觉性,这得到了轶事证据和一些临床研究的支持。尽管这些临床案例在训练期间未被模型看到,TxGNN的预测和解释理由与关于佐匹克隆作用机制的医学证据相一致。


接下来,研究团队检查了TxGNN对Ehlers-Danlos综合症的预测,这是一种影响每10万人中1到9人的罕见结缔组织疾病。该疾病由胶原蛋白编码基因(COL1A1和COL1A2)的突变引起,特征为伤口愈合不良和异常疤痕。TxGNN预测器将用于治疗痤疮的维生素A衍生物——维A酸,排名为首个药物再利用候选。维A酸通过白蛋白(ALB)运输,靶向ALDH1A2,有助于减轻胶原蛋白流失和炎症,正如TxGNN的预测理由所强调的(图5c),表明TxGNN的预测理由与医学推理一致。维A酸可能通过促进皮肤中胶原蛋白的生成来帮助Ehlers-Danlos综合症,从而改善伤口愈合和疤痕的外观。此外,Ehlers-Danlos综合症的一些亚型与ALB基因的致病突变有关,并与ALDH1AI有微弱关联。TxGNN解释器关于连接维A酸与Ehlers-Danlos综合症的途径的推理与这些证据一致。


在最后一个例子中,研究团队关注了一种罕见疾病——肾源性不当抗利尿综合症(NSIAD)。该疾病的特征是由于AVPR2基因突变引起的水和钠不平衡。患有充血性心力衰竭的患者面临类似的液体滞留挑战,该病与AVPR2和NPR1基因有很强的关联。TxGNN预测器在前五种药物中识别了硝酸胺(图5d)。TxGNN解释器建议NSIAD与硝酸胺之间的关系经过AVPR2、充血性心力衰竭和NPR1。AVPR2和NPR1基因在通过互补但不同的途径调节液体和电解质平衡中起着关键作用。AVPR2促进水的滞留和尿液浓缩,而NPR1则促进血管扩张、降低血压并增强水的排泄。增强NPR1活性可以抵消NSIAD患者中因AVPR2受体功能障碍而引起的过度水重新吸收。靶向NPR1基因的硝酸胺,成为NSIAD的潜在治疗选择,证实了TxGNN解释与医学证据的一致性。


图5:TxGNN产生的药物再利用预测和多跳可解释路径与医学证据一致


使用电子医疗记录(EMRs)评估 TxGNN


TxGNN 的强大表现表明,其新颖的预测——即尚未获得临床批准但在 TxGNN 中排名靠前的药物——可能具有潜在的临床价值。由于这些疗法尚未获得治疗批准,因此没有已建立的金标准可供验证。考虑到长期存在的临床脱离标签处方实践,研究团队使用疾病-药物对在医疗系统电子病历中的共现富集作为潜在指示的代理测量。


从梅奥医学中心(Mount Sinai Health System)医疗记录中,研究团队整理了 1,272,085 名至少有一次药物处方和一次诊断的成人病例(图 6a)。该队列中男性占 40.1%,平均年龄为 48.6 岁(标准差 18.6 岁)。人口统计信息见图 6b 和 6c。疾病被纳入条件是至少有一名患者被诊断为该疾病,药物被纳入条件是至少有十名患者获得处方,最终得到 478 种疾病和 1,290 种药物的数据集(图 6d)。


在这些医疗记录中,研究团队测量了疾病-药物共现的富集程度,计算了特定药物用于某一疾病的概率与用于其他疾病的概率之比。研究团队为每对药物-疾病组合得出了 619,200 个对数(odd ratio) (log(OR)) 值,并进行了必要的统计修正。研究团队发现,FDA 批准的药物-疾病对的 log(OR) 值显著高于其他组合(图 6e)。禁忌症可能在此分析中是一个潜在的混杂因素,因为不良药物事件可能增加药物-疾病对之间的共现。然而,在对禁忌症的研究中,研究团队发现药物-疾病对的共现没有富集,这表明不良药物效应并不是一个主要的混杂因素。


对于每种 478 种通过电子病历表型的疾病,TxGNN 生成了一份治疗候选药物的排名列表。研究团队排除了已与疾病相关的药物,将剩余的新候选药物分类为前 1、前 5、前 5% 和后 50%,并计算了各自的平均 log(OR) 值(图 6f)。排名最高的(前 1)预测药物的 log(OR) 值平均比后 50% 预测的 log(OR) 值高出 107%。这表明 TxGNN 的最高候选药物在医疗记录中的富集程度更高,因此更有可能是相关指示。此外,随着检索候选药物比例的扩大,log(OR) 也在增加,这表明 TxGNN 的预测分数在捕捉指示可能性方面是有意义的。尽管平均 log(OR) 为 1.09,但 TxGNN 预测的最佳治疗候选药物的 log(OR) 达到 2.26,接近 FDA 批准指示的平均 log(OR) 2.92,显示出 TxGNN 排名前列的预测中脱离标签处方的富集。


在分析 TxGNN 对威尔逊病的预测时,威尔逊病是一种罕见疾病,会导致过量铜积累,常常在儿童中引发肝硬化(图 6g),研究团队观察到 TxGNN 预测大多数药物的可能性接近于零,仅有少数药物被认为极有可能是指示。TxGNN 将去铁酮(deferasirox)排名为威尔逊病最有前途的候选药物。威尔逊病与去铁酮在医疗记录中的 log(OR) 值为 5.26,文献表明去铁酮可能有效消除肝脏中的铁。在另一项分析中,研究团队评估了 TxGNN 在知识截止日期后引入的十个最近的 FDA 批准药物。TxGNN 一贯地对新引入的药物进行了有利的排名,并且在两个实例中将新批准的药物列入预测药物的前 5%。


图6:在大型医疗系统中评估TxGNN的预测


结论与前景


药物重定位已被视为一种药物发现方法,以解决新药开发的成本、市场时间和固有风险等生产力问题。尽管传统的“单疾病-单预测模型”方法用于增强药物重定位的成功率,但大多数成功案例源于临床和临床前体内研究中的意外发现。研究团队提出,通过多疾病预测策略,可以实现对药物重定位的全面方法。现有预测模型通常假设针对某一疾病或相关疾病存在有效药物,这一假设忽视了分析的 17,080 种疾病中 92% 的疾病缺乏既有指示和已知分子靶点相互作用。解决这些复杂、被忽视或罕见疾病的需求是临床优先事项。研究团队将这一挑战定义为零样本药物重定位。


研究团队开发了 TxGNN,这是一种图基础模型,专门针对数据和治疗机会有限的疾病,直接应对这一挑战。TxGNN 通过利用关注疾病-治疗机制的网络医学原则,在药物重定位中实现了先进的性能。当被要求为某种疾病建议治疗候选药物时,TxGNN 会识别具有共享通路、表型和病理的疾病,提取相关知识并融合到感兴趣的疾病中。TxGNN 通过建模疾病之间的潜在关系,能够推广到治疗选择较少的疾病,并对在训练中从未遇到的疾病进行零样本推断。TxGNN 的设计使其能够有效进行零样本药物重定位,并可适用于其他用例,如药物靶点发现和靶向治疗选择。


TxGNN 是一个统一模型,用于预测 17,080 种疾病的适应症和禁忌症,适合于早期药物重定位,超越单一治疗领域。研究结果表明,多疾病预测模型相比于单领域方法能产生更多重定位药物候选者。预测的药物与电子医疗记录中的脱离标签处方率相符,并与医学专家的医学共识一致。尽管这些估计表明现有药物具有潜在的治疗效益,但预测的药物仍需广泛筛查以确定安全性和有效性,并确定其他药物参数,如药物剂量以及治疗的顺序和时机。


TxGNN 生成多跳可解释的解释,为预测的药物提供合理依据。这些理由可用于分析,以评估预测药物是否可能引发额外的生物反应,考虑 TxGNN 确定的原始指示或分子靶点相互作用。初步的人类评估表明,专家能够通过多跳解释更有效地检查预测药物,并识别失败点,而非替代的解释可视化。这些发现确认了在将机器学习模型融入发现工作流时,考虑临床需求和可解释性的重要性。


思考与挑战


尽管 TxGNN 在零样本药物重定位方面展示了良好的性能,但其能力依赖于医学知识图谱的质量。这些图谱可能需要更全面的信息,以处理宿主-病原体相互作用,这是重定位感染性疾病药物所必需的,以及关于遗传变异致病性的相关信息,这对于识别遗传疾病的重定位机会至关重要。必须解决数据偏见和医学知识图谱中可能过时的信息等挑战。克服这些问题的策略包括使用持续学习和模型编辑技术,以及在新数据可用时自动更新知识图谱的数据管理方法。另一个有前景的未来方向是使用不确定性量化技术来评估模型预测的可靠性。研究团队还设想将患者信息与医学知识图谱结合,以提供个性化的药物重定位预测。初步的人类评估涉及少量(n=12)临床医生和科学家,优先考虑对小规模但合格的专家组进行深入分析,而不是在更广泛的研究中涉及更多、可能较少专业化的参与者。尽管结果令人鼓舞,并且该参与者数量代表了评估高度专业工具的相关研究,但进行一项样本量更大的人工评估研究可以涵盖更广泛的用户专业知识,并考虑各种药物重定位的用例。尽管 TxGNN 对医疗记录的预测表现良好,但未考虑的混杂因素和选择偏差可能限制了对计算出的药物富集分数得出结论的能力。


TxGNN 的零样本药物重定位能力使模型能够为治疗选择有限和信息稀缺的疾病预测药物。多跳可解释的预测理由可以增强 TxGNN 的透明使用,促进信任并帮助人类专家。在疾病特定数据集有限的情况下,TxGNN 简化了药物重定位预测,突出表明 AI 模型在新疗法开发中的潜力。


链接

  • 引文:
    Huang, K., Chandak, P., Wang, Q. et al. A foundation model for clinician-centered drug repurposing. Nat Med (2024).
  • 原文链接:https://doi.org/10.1038/s41591-024-03233-x
  • 代码链接:研究中开发并使用的方法:
    https://zitniklab.hms.harvard.edu/projects/TxGNN;
    重现结果的代码、文档和使用示例:
    https://github.com/mims-harvard/TxGNN;
  • 基于网页的应用程序:
    http://txgnn.org
  • 数据链接:
    https://doi.org/10.7910/DVN/IXA7BM


启发


我们可以通过进一步优化图神经网络(GNN)与自监督学习相结合的方式,提升零样本药物再利用的预测精度与广泛适用性。相比这项研究提出的TxGNN模型,我们可以引入多模态数据整合与跨域迁移学习策略,以进一步增强模型在不同数据类型和稀缺数据场景下的适应能力。除了利用现有的医学知识图谱,还可以整合基因组数据、蛋白质组数据、患者表型数据等多模态生物学信息,并通过跨模态对比学习(cross-modal contrastive learning)来统一不同数据的表示,从而在多维度上捕捉疾病与药物之间的潜在联系。此外,结合生成对抗网络(GAN)或变分自编码器(VAE),可以生成与罕见疾病或缺乏样本的疾病相关的模拟数据,填补训练数据的不足,从而进一步提升模型的泛化能力。通过这种方式,模型不仅可以应对数据稀疏的挑战,还能从现有的多模态数据中学习到更加丰富的特征表示,进而改善零样本场景下的药物再利用预测效果。


编辑:于腾凯
校对:丁玺茗



关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。



新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU