激素受体阳性
(HR+)
/人表皮生长因子受体2阴性
(HER2-)
乳腺癌是乳腺癌中最为常见的亚型,占所有乳腺癌病例的65%~70%
【1】
,此类患者面临长期的复发风险,现有预测模型大多基于少量维度数据,预测效能具有一定局限性
【2】
。如何提高复发预测的准确性,成为亟待解决的重要临床挑战。
近日,来自复旦大学附属肿瘤医院
邵志敏
教授、
肖毅
副研究员团队在
Cell Reports Medicine
杂志发表了一篇题为
Multimodal integration using a machine learning approach facilitates risk stratification in HR+/HER2- breast cancer
的研究论文。
该研究基于团队前期已构建的大规模HR+HER2-乳腺癌多模态队列
【3】
,
整合基线临床数据,多维度免疫组化、代谢组、病理组、转录组、基因组和拷贝数变异信息,构建了多模态机器学习预测模型
,
该模型在预测HR+HER2-乳腺癌复发风险方面表现出不错的性能,一致性指数
(C-index)
在训练集和测试集分别达到0.871和0.869,可准确预测74.2%的复发患者和85.8%的未复发患者
(图1)
。
多模态模型预测性能显著优于传统模型,原因可能在于多模态特征间的协同互补效应,其中研究者发现同源重组修复缺陷
(HRD)
评分与多个模态特征表现出显著正相关性,这些特征之间复杂作用揭示了HRD与多种细胞生物学行为的紧密联系,为多模态模型较好的预测效能提供了理论基础。此外,研究团队分别使用单一模态信息构建单模态模型,发现各单模型间的风险预测相对独立,不同单模态模型计算出的风险评分相关性较低,预测的高危患者差异较大,表明不同模态之间包含丰富的协同及互补信息,多模态模型能有效地整合这些协同互补特征,从而提升对患者复发风险的预测精准度,为临床风险分层与精准治疗决策提供更具价值的工具。
为降低多模态数据收集成本,该团队进一步简化了多模态模型,在保留临床中常规收集的临床信息,多维免疫组化和病理组学的全部特征的同时,利用留一法计算了特征重要性评分,分别筛选出代谢组、转录组、基因组和拷贝数变异中最重要的2-3个特征,显著减少了数据维度。简化模型在测试中的平均曲线下面积
(AUC)
达到0.84,依然表现出较高的预测性能。这一改进为多模态模型快速推广及临床应用提供了可能。
综上所述,该研究通过整合多维度信息构建了预测HR+HER2-乳腺癌复发的多模态模型,并阐明多模态模型背后性能提升的潜在原因,最终通过精简模型特征构建了多模态简化模型,为临床应用提供了新手段。
复旦大学附属肿瘤医院肖毅副研究员,邵志敏教授、江一舟教授团队为本文的通讯作者,复旦大学附属肿瘤医院张航博士,杨帆博士,徐颖博士为本文第的共同第一作者,复旦大学附属肿瘤医院赵珅博士为该工作提供了重要帮助。团队对这一多模态模型申请了相关专利,后续将继续开展相关转化工作。
原文链接:https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(24)00695-5
制版人:十一
1. Huppert, L.A., et al., Systemic therapy for hormone receptor-positive/human epidermal growth factor receptor 2-negative early stage and metastatic breast cancer.
CA Cancer J Clin
, 2023. 73(5): p. 480-515.
2. Prat, A., et al., Concordance among gene expression-based predictors for ER-positive breast cancer treated with adjuvant tamoxifen.
Ann Oncol
, 2012. 23(11): p. 2866-2873.
3. Jin, X., et al., Molecular classification of hormone receptor-positive HER2-negative breast cancer.
Nat Genet
, 2023. 55(10): p. 1696-1708.
BioART战略合作伙伴
(*排名不分先后)