精简版推文:
选文:大壮
整理:小黄
好的论文也是靠套路,本文是联邦学习+国际多中心。
中秋快乐!
paper多多!
0.1 论文信息
0.2 期刊信息
0.3 研究背景
在医学领域中,尤其是儿童脑肿瘤的诊断和治疗,常常受到数据共享和隐私问题的限制,为了解决这一问题,论文提出了一种联邦学习(Federated Learning, FL)的人工智能平台,名为FLPedBrain。这个平台能够在不直接共享数据的情况下,跨多个医院进行训练,从而克服了数据共享的障碍,同时保护了患者隐私。
联邦学习也是老概念了。
图来《
Intel and Penn Medicine Announce Results of Largest Medical Federated Learning Study
》
0.4 名词解释
鲁棒性(Robustness)
是指系统或方法在面对各种不确定性、扰动或变化时,仍能保持稳定性和可靠性。
联邦平均
(Federated Averaging)
是一种用于联邦学习(Federated Learning, FL)的优化算法。其基本思想是将模型的训练过程分散到多个参与者上,然后通过聚合这些参与者计算的模型更新来改进全局模型。
1 研究介绍
1.1 目的
FLPedBrain平台的目标是通过联邦学习,
提高肿瘤分类和分割的性能
,这对于手术前的精确诊断、治疗规划和疾病监测至关重要。
1.2 方法
(1)
使用1.5T或3T MRI系统获取脑部MRI图像,研究共有19个站点,
其中16个参与模型训练和验证,其余3个作为外部保留站点。
(2)总共有1468例儿童脑肿瘤患者的数据,
包含患者的
影像和病理
数据,进行了肿瘤分类和分割。
(3)开发了一个3D模型,
使用了
联邦学习(FL)方法
进行模型训练,
用于肿瘤病理预测和分割。
(4)与传统的集中式数据共享(CDS)方法对比并进行性能评估。
1.3 结果
(1)
与集中数据训练相比,FL-PedBrain在分类性能上仅减少了不到1.5%,在分割性能上减少了3%。
(2)FL在三个外部网络之外的站点上提高了20%到30%的分割性能。
1.4 结论
(1)FL-PedBrain平台对于儿童后颅窝脑肿瘤的联合学习具有有效性。
(2)尽管存在数据异质性,FL-PedBrain仍然在所有19个站点上展现了高泛化性能。
2 数据介绍
本研究纳入了1468名后颅窝肿瘤患者,其中包括596例髓母细胞瘤(MB)、210例胶质母细胞瘤(EP)、335例旁脑室胶质瘤(PA)和327例脑干胶质瘤(DIPG)。
3 研究方
法
3.1 模型开发和评估
(1)研究人员开发了一个3D模型,用于肿瘤病理预测(MB、EP、PA、DIPG、正常)和分割掩膜。
(2)使用联邦学习(FL)方法进行模型训练,通过“联邦平均”(Federated Averaging)方法实现。
(3)与传统的集中式数据共享(CDS)方法进行了比较,在CDS方法中,将所有数据集中到一个池中进行训练。
(4)
除了FL方法,还对比了“孤立”模型,该模型仅使用单一站点的数据进行训练,并在16个保留验证集和3个独立外部站点上进行评估。
3.2训练流程
(1)联邦学习中,
各站点仅共享模型参数
而非原始数据。
(2)每轮FL训练开始时,各站点进行本地模型训练,然后将学习到的权重传回中央服务器。
(3)中央服务器对来自各个站点的模型权重进行平均,从而更新全局模型。
探索了数据异质性的来源,包括影像质量差异和站点特定的肿瘤特征变异。
4 结果
4.1
分类性能
(1)FL(联邦学习)和 CDS(集中式学习)的分类性能相当,没有统计学上的显著差异。
(2)Siloed training(孤立训练)性能明显较差,且不同站点的表现差异很大。
4.2 分割性能
(1)FL 在分割任务中的总体表现接近 CDS。
(2)Siloed training 在分割任务中的性能下降超过 20%,且性能下降幅度大于分类任务。
(3)FL 和 CDS 在 DIPG(脑干胶质瘤)肿瘤上的分割性能最佳,而 MB(髓母细胞瘤)的性能较低。
(4)在肿瘤子组中,FL 与 CDS 在 MB 和 PA(旁脑室胶质瘤)上的性能相当,但在 EP(胶质母细胞瘤)和 DIPG 上 FL 表现稍逊。
4.3 数据异质性
(1)数据异质性主要体现在样本大小和病理子组的不平衡,一些站点完全没有某些肿瘤类型。
(2)T2-MRI 像素方差在不同站点间存在差异,尤其是 DIPG 和 PA。
(3)相对肿瘤体积在不同站点间也存在显著差异。
尽管存在这些异质性,研究没有发现数据异质性对模型性能的显著影响。
4.4 训练和可视化
(1)FL 和 CDS 在训练中的收敛情况有所不同,CDS 需要较少的学习更新次数。
(2)FL 训练模型的分割结果和 ground-truth 比较显示出良好的匹配。
(3)t-SNE 可视化展示了 FL-PedBrain 分类模型的特征,展示了肿瘤特征的独特性。
5 学习心得
(1)FLPedBrain平台的开发实现了数据的高效利用,这对于推动医学AI的发展具有重要意义。
(2)研究中对数据异质性的深入分析和处理,以及对模型泛化能力的验证,都突显了在实际应用中考虑数据多样性和模型鲁棒性的必要性。
引用
[1]
Lee EH, Han M, Wright J, Kuwabara M, Mevorach J, Fu G, Choudhury O, Ratan U, Zhang M, Wagner MW, Goetti R, Toescu S, Perreault S, Dogan H, Altinmakas E, Mohammadzadeh M, Szymanski KA, Campen CJ, Lai H, Eghbal A, Radmanesh A, Mankad K, Aquilina K, Said M, Vossough A, Oztekin O, Ertl-Wagner B, Poussaint T, Thompson EM, Ho CY, Jaju A, Curran J, Ramaswamy V, Cheshier SH, Grant GA, Wong SS, Moseley ME, Lober RM, Wilms M, Forkert ND, Vitanza NA, Miller JH, Prolo LM, Yeom KW. An international study presenting a federated learning AI platform for pediatric brain tumors. Nat Commun. 2024 Sep 2;15(1):7615. doi: 10.1038/s41467-024-51172-5. PMID: 39223133; PMCID: PMC11368946.
感谢您的阅读,如果您对这项研究感兴趣或想了解更多关于AI在医学中的应用,请继续关注我们,我们会定期分享最新的科研成果和健康资讯。别忘了点赞和转发哦!👍🔄