专栏名称: ioncology
《肿瘤瞭望》于2014年初创刊,由著名肿瘤科专家徐兵河教授担任总编辑,以“同步传真国际肿瘤进展”为办刊宗旨,以循证医学理念为指导思想,采用全媒体组合报道模式,致力于为国内广大肿瘤临床、教研人员搭建一座与国际接轨的桥梁。
目录
相关文章推荐
FM93交通之声  ·  她被永久封禁!彻底凉凉 ·  7 小时前  
钱江晚报  ·  吴君如发文悼念 ·  15 小时前  
FM93交通之声  ·  确认了!今天影响浙江! ·  18 小时前  
杭州日报  ·  1万元,连发3年!杭州这笔钱别忘了申请 ·  2 天前  
51好读  ›  专栏  ›  ioncology

何建行/梁文华团队Lancet Oncology发表预测肺癌基因突变的病理人工智能新工具及多中心验证研究

ioncology  · 公众号  ·  · 2024-12-10 17:21

正文


点击上方蓝字 关注我们



2024年12月7日,广州医科大学附属第一医院何建行/梁文华教授团队,联合腾讯AI lab及全国15个医疗中心的研究者,在国际顶级期刊 Lancet Oncology (中国科学院/ JCR一区,IF=41.6) 在线发表研究“Deep learning using histological images for gene mutation prediction in lung cancer: a multicentre retrospective study” [1] 该研究开发了一种深度学习驱动的人工智能工具-DeepGEM,实现了无需标注、仅通过常规获取的组织学切片即可预测肺癌患者的基因突变,并在迄今为止数据量最大的多中心数据集上进行了验证。 广州医科大学附属第一医院、广州呼吸健康研究院、国家呼吸医学中心何建行教授、梁文华教授,腾讯AI lab专家研究员姚建华博士,中南大学湘雅医院胡成平教授,湖南省肿瘤医院邬麟教授为该论文的共同通讯作者;腾讯AI lab赵宇博士,广州医科大学附属第一医院熊珊博士,腾讯AI lab任琴、王珺,中南大学湘雅医院李敏博士,深圳市人民医院杨林主任为本论文的共同第一作者。 (文末添加学术助手发送【学习】获取全文)


01

研究背景

肺癌患者的精准和个性化治疗方案高度依赖于对驱动基因突变的精准检测。然而,常规的基因检测方法 (二代测序NGS)需要高质量的组织样本,且检测过程耗时,在晚期急症肺癌患者中的应用受限 。此外, 由于价格昂贵,导致很多患者,尤其是在资源匮乏地区的患者无法及时获得此项检测。

近些年,随着人工智能的发展,深度学习在预测病理图像中的分子信息方面表现出色,为肺癌患者的精准诊疗提供了新的方法和思路。团队既往的研究成果也发现, 特定基因突变类型的肺腺癌表现出高级别病理成分的富集 [2] 。基于此,团队联合腾讯AI lab及全国15个医疗中心开发了一种人工智能模型来学习 基因型-病理表型 间的相关性,能够利用常规获取的组织学切片来预测基因突变,为肺癌患者提供了一种高效、经济、及时的基因突变检测新方法。


02

研究设计

团队收集了来自中国16家医院及公共数据库癌症基因组图谱(TCGA)中的肺癌患者数据,纳入的患者均接受了活检和多基因二代测序,组建了 迄今为止数据量最大 的配对病理图像和多基因突变信息的多中心数据集。模型训练及验证主要由4个队列组成:内验数据集由广州医科大学附属第一医院1716名肺癌患者组成,外验数据集由15家全国多中心的1718例肺癌患者组成,TCGA数据库中的473例患者用于不同人种进一步的验证。此外,使用了来自与内验数据集相同医疗中心但彼此不重叠的患者数据集,以评估模型在淋巴结转移活检样本上的泛化能力。

数据集分为手术活检组和穿刺活检组分别作为输入,以开发基因突变模型DeepGEM。DeepGEM是一种具有标签 消歧设计的示例级 袋级联合监督 的多示例学习(multi-instance learning, MIL)方法,能高效地从图像中学习信息特征。该模型预测的流程是输入完整的组织学图像, 无需额外的注释 ,DeepGEM即可预测常见突变EGFR、KRAS、ALK、ROS1、TP53、LRP1B每种突变的概率,并输出相应的突变分布的空间基因热图。


03

研究结果

DeepGEM模型在内验数据集中表现出良好的性能:对于切除活检样本,基因突变预测的AUC值范围为 0.90(95% CI 0.77–1.00)至0.97(0.93–1.00) ,准确度值范围为0.91(0.85–0.98)至0.97(0.93–1.00);对于穿刺活检样本,AUC值范围为 0.85(0.80–0.91)至0.95(0.86–1.00) ,准确度值范围为0.79(0.74–0.85)至0.99(0.98–1.00)。

在15家多中心外验数据集中,DeepGEM也表现出良好的预测性能。对于切除活检样本,AUC值范围为 0.80(95% CI 0.75–0.85)至0.91(0.88–1.00) ,准确度值范围为0.79(0.76–0.82)至0.95(0.93–0.96);对于穿刺活检样本,AUC值范围 为0.76(0.70–0.83)至0.87(0.80–0.94) ,准确度值范围为0.76(0.74–0.79)至0.97(0.96–0.98)。

在TCGA数据集(473名患者;535幅切片)上DeepGEM也表现出优异的性能,AUC值范围为 0.82(95% CI 0.71–0.93)至0.96(0.91–1.00) ,准确度值范围为0.79(0.70–0.88)至0.95(0.90–1.00),体现了DeepGEM在不同背景人种间的泛化能力。

此外,使用以上三个数据集将 DeepGEM 模型与 现有的基于 AI 的基因突变预测方法DeepPATH [3] 、MIL-RNN [4] 、CLAM [5] 、TOAD [6] 进行比较时,DeepGEM 模型均表现出了卓越的性能 (下图分别为内验、TCGA、外验数据集多方法对比的结果)。







请到「今天看啥」查看全文