专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生物制品圈  ·  冷冻干燥热敏性药物:含有机共溶剂 + 水的配方 ·  3 天前  
生信人  ·  神经内分泌:聚焦难治性肿瘤 ·  3 天前  
51好读  ›  专栏  ›  生信菜鸟团

精准医学 | Nat.Med | 使用常规血液检测和临床数据预测癌症检查点抑制剂免疫治疗的疗效

生信菜鸟团  · 公众号  · 生物  · 2025-02-06 10:00

正文

Basic Information

  • 英文标题: Prediction of checkpoint inhibitor immunotherapy efficacy for cancer using routine blood tests and clinical data
  • 中文标题:使用常规血液检测和临床数据预测癌症检查点抑制剂免疫治疗的疗效
  • 发表日期:06 January 2025
  • 文章类型:Article
  • 所属期刊:Nature Medicine
  • 文章作者:Seong-Keun Yoo | Diego Chowell
  • 文章链接:https://www.nature.com/articles/s41591-024-03398-5

Abstract

Para_01
  1. 预测癌症患者是否能从免疫检查点抑制剂(ICIs)治疗中获益,而不依赖于高级基因组或免疫测定,是一个重要的临床需求。
  2. 为了解决这个问题,我们开发并评估了SCORPIO,这是一个机器学习系统,它利用常规血液检测(全血细胞计数和全面代谢谱)以及来自21种癌症类型的9,745名ICI治疗患者的临床特征。
  3. SCORPIO是在纪念斯隆凯特琳癌症中心的1,628名患者(涉及17种癌症类型)的数据上进行训练的。
  4. 在两个内部测试集中,包括19种癌症类型的2,511名患者,SCORPIO在预测总体生存率方面达到了6、12、18、24和30个月的接收者操作特性曲线下的时间依赖性面积(AUC(t))中位值分别为0.763和0.759。
  5. 这优于肿瘤突变负荷(TMB),TMB的中位AUC(t)值分别为0.503和0.543。
  6. 此外,SCORPIO在预测临床效益(肿瘤反应或延长稳定性)方面表现出优越的预测性能,AUC值分别为0.714和0.641,而TMB的AUC值分别为0.546和0.573。
  7. 外部验证使用了10个全球3期试验(涉及6种癌症类型的4,447名患者)和来自西奈山健康系统的现实世界队列(涉及18种癌症类型的1,159名患者)。
  8. 在这些外部队列中,SCORPIO在预测ICI结果方面保持了强大的表现,超过了程序性死亡配体1免疫染色。
  9. 这些发现强调了SCORPIO的可靠性和适应性,突显了其在多种癌症类型和医疗环境中预测ICI治疗患者结果的潜力。

Main

Para_01
  1. 免疫检查点抑制剂(ICIs),如抗细胞毒性T淋巴细胞相关抗原4(CTLA-4)或抗程序性死亡1(PD-1)/程序性死亡配体1(PD-L1)药物可以在一部分患有晚期癌症的患者中诱导持久的反应。
  2. 然而,大多数患者承受了治疗费用却未能获得持久的临床效益。
  3. 因此,一个能够预测ICI药物疗效的模型将在精准医疗中产生重要影响,通过帮助医生识别更可能或不太可能从这些治疗中受益的患者。
Para_02
  1. 肿瘤突变负荷(TMB)和PD-L1表达是美国食品药品监督管理局(FDA)批准用于此目的的生物标志物2,4,5。
  2. 然而,这些生物标志物的准确性有限6,7,并且存在实际限制,这些限制阻碍了它们的广泛应用,例如TMB需要足够的肿瘤组织和资源来对DNA进行测序,以及PD-L1免疫组化缺乏标准化的抗体克隆和评分系统3。
  3. 因此,临床需要一种可以轻松获得、成本低廉且在不同地理区域和医疗系统中快速周转的定量预测标志物。
Para_03
  1. 一个理想的候选者来评估ICI疗效可能包括广泛可用的临床变量和来自实验室血液测试的标准测量,这些测试在现代医学中常规使用。
  2. 值得注意的是,一些研究已经报告了体重指数(BMI)、中性粒细胞与淋巴细胞比率(NLR)或白蛋白(ALB)与对ICI反应之间的关联。
  3. 然而,尚未有综合分析临床和实验室数据及其预测不同癌症类型ICI结果潜力的报道。
Para_04
  1. 机器学习是人工智能的一个分支,使算法能够从数据中学习,识别关键模式并做出预测。
  2. 这些模型已经在各种生物医学领域显示出成功。
  3. 在这项研究中,我们探讨了一个机器学习系统是否可以使用常规血液检测和标准临床变量来预测ICI(免疫检查点抑制剂)的疗效。
  4. 我们在三个真实世界队列和10个全球三期临床试验队列上训练、测试并外部测试了一个机器学习模型,以预测ICI的疗效。

Results

Study cohorts

研究队列

Para_01
  1. 这项研究包括来自纪念斯隆凯特琳癌症中心(MSKCC)、西奈山卫生系统(MSHS)和10个全球三期临床试验的9745名患有21种不同癌症类型的患者接受免疫检查点抑制剂(ICIs)治疗(图1a、扩展数据表1-3和补充图1)。

Fig. 1: Schematic of the study design and analysis.

  • a, 队列收集。顶部:使用了来自MSKCC的真实世界队列(MSK-I)进行模型开发。中部:使用了来自MSKCC(MSK-II)和MSHS的两个真实世界队列。底部:使用了10个全球三期临床试验。ITT,意向治疗。
  • b, 特征选择分析。顶部:在MSK-I队列中为模型开发收集的特征数量。底部:使用Cox比例风险回归或Cochran-Mantel-Haenszel检验测试了47个特征与总体生存率之间的关联性。在两种检验中,系统治疗史都被调整为混杂因素。
  • c, 机器学习分析。顶部:构建用于预测总体生存率和临床获益的独立模型。中部:使用ROC和AUC(受试者工作特性曲线和受试者工作特性曲线下面积)比较模型性能。底部:评估模型性能。在这两个机器学习模型中,表现最好的那个在保留测试集上进行了分析。
Para_02
  1. 为了开发模型,我们首先回顾性地收集了从2014年到2019年在MSKCC接受免疫检查点抑制剂(ICIs)治疗的17种癌症类型的2,035名患者的资料(此后称为MSK-I),这些资料被随机分为训练集(n = 1,628)和预留测试集(n = 407),比例为80:20。
  2. 我们使用该队列的训练集开发了机器学习模型,然后在预留测试集中测试了这些模型。
  3. 随后,我们在另一个独立的队列中进一步测试了模型,该队列包含2011年至2020年期间在MSKCC接受ICIs治疗的另外2,104名患者(此后称为MSK-II)。
  4. MSK-II队列是在初始模型开发后收集的,并且与MSK-I队列使用相同的纳入和排除标准,但合格年限扩展到了2011年至2020年期间接受治疗的患者。
  5. 之后,我们在全球10项III期临床试验中的4,447名接受ICIs治疗的患者中对外部测试了该模型。
  6. 此外,该模型还在一个真实世界队列中进行了外部测试,该队列包括2011年至2019年期间在MSHS接受ICIs治疗的1,159名患者,MSHS是一个服务于纽约大都市地区多样患者群体的大型综合性医疗系统。
  7. 我们还分析了在MSKCC接受癌症治疗但未接受ICIs的6,629名患者(此后称为MSK非ICIs;扩展数据表4)。
  8. 有关患者纳入和排除标准的详细信息,请参见方法和补充图2和3。

Characteristics of the patient data

患者数据的特点

Para_01
  1. 患者接受了PD-1抑制剂(n = 3,793)的治疗,PD-L1抑制剂(n = 5,253)的治疗,CTLA-4抑制剂(n = 72)的治疗或多种药物组合的治疗(n = 627),包括抗CTLA-4与抗PD-1、抗CTLA-4与抗PD-L1、抗CTLA-4与抗PD-1和抗PD-L1以及抗PD-1和抗PD-L1的联合治疗。
  2. 每个队列的中位随访时间如下:训练集为25.38个月(四分位距(IQR)13.50–45.01),留出测试集为27.37个月(IQR 13.68–49.58),MSK-II队列为9.42个月(IQR 3.10–20.67),MSHS队列为8.84个月(IQR 2.75–28.47),临床试验队列整体为13.64个月(IQR 6.72–19.86)。
  3. 10个临床试验队列包括了来自12个实验臂的患者,这些患者接受阿特珠单抗(抗PD-L1)治疗:IMbrave150(参见文献20),IMspire150(参见文献21),IMmotion151(参见文献22),IMvigor211(参见文献23),IMpower133(参见文献24),IMpower130(参见文献25),IMpower131(阿特珠单抗加卡铂和白蛋白结合型紫杉醇(ACNP))26,IMpower131(阿特珠单抗加卡铂和紫杉醇(ACP))26,IMpower132(参见文献27),IMpower150(阿特珠单抗加贝伐珠单抗、卡铂和紫杉醇(ABCP))28,IMpower150(ACP)28和OAK29。
  4. 每个临床试验队列的中位随访时间在扩展数据表3中提供。
  5. 我们分析了膀胱癌、肝胆癌、黑色素瘤、非小细胞肺癌(NSCLC)、肾细胞癌(RCC)和小细胞肺癌(SCLC)作为单独的癌症类型,因为它们在所有可用的队列中都有收集。
  6. 其余的癌症类型在每个队列中被归类为‘其他’。

Clinical features and outcomes

临床特征和结果

Para_01
  1. 我们回顾性收集了临床变量和标准化测量数据,这些数据来自首次免疫检查点抑制剂(ICI)输注日期或之前不超过30天内进行的常规实验室血液检测(图1b和补充表1)。
  2. 在MSKCC队列中,TMB是根据FDA授权的MSK-IMPACT平台从患者的肿瘤中收集的31。
  3. 在临床试验队列中,收集了使用SP142或SP263克隆(Ventana Medical Systems)进行的PD-L1免疫染色数据(方法部分)。
  4. 两个主要结果是总生存期和治疗效果,后者以临床获益来衡量。
  5. 总生存期是从首次ICI输注到因任何原因死亡的时间测量,对于接受多次ICI治疗的患者,首先使用一线治疗。
  6. 对于临床试验队列,总生存期是从随机化到因任何原因死亡的时间测量。
  7. 在审查时仍然存活的患者在其最后一次联系时被删失。
  8. 临床获益定义为患者肿瘤在首次ICI输注后至少6个月内显示完全缓解(CR)、部分缓解(PR)或稳定疾病(SD)而没有进展,如先前研究所述32,33,34,35。
  9. 在首次ICI输注后6个月内显示PD或SD的患者被归类为没有临床获益。
  10. CR、PR、SD和PD基于RECIST v1.1标准36。
  11. 两个主要结果在MSKCC和临床试验队列中均可用,但只有总生存期数据在MSHS队列中可用。
  12. 有关临床特征和结果的描述,请参阅方法部分。

Development of the machine learning model

机器学习模型的开发

Para_01
  1. 在模型训练之前,我们对训练集进行了特征选择分析,以识别与免疫检查点抑制剂(ICI)治疗目标结果相关的特征(图1b和补充图4)。
  2. 我们使用人口统计学、临床和常规实验室血液检测数据开发了两个机器学习模型来预测ICI给药后的结果,其中一个用于预测总体生存率,另一个用于预测临床获益(完全缓解、部分缓解和病情稳定≥6个月),并选择了在预留测试集中表现最好的一个模型(图1c)。
  3. 每个模型由三种算法组成,采用软投票法。在训练过程中,使用五折交叉验证(CV)优化每个算法的超参数。
  4. 在模型训练期间,训练集被分为五个大小相等的折叠,每个折叠包含相同比例的数据。
  5. 然后,该算法经历了五次迭代的训练和评估。
  6. 在每次迭代中,四个折叠用于训练,一个折叠用于验证。
  7. 模型性能通过总体生存率的谐和指数(C-指数)和临床获益的受试者工作特性曲线下的面积(AUC)进行评估。
  8. 从五次迭代中的性能指标被平均以获得单一性能测量。
  9. 这一过程重复了所有可能的超参数组合,选择了具有最高性能指标的超参数作为最优超参数。
Para_02
  1. 训练用于预测总体生存期的模型SCORPIO(标准临床和实验室特征用于免疫治疗结局预测)计算一个从0到1的风险评分,评分越高表示在接受ICI治疗后预后较差(即疗效不佳或早逝)的概率越高。
  2. 该模型使用通过特征选择分析显著关联于总体生存期的33个特征进行训练(补充图4a和补充表2)。
  3. 类似地,训练用于预测临床获益的SCORPIO-CB生成一个从0到1的概率评分,评分越高表示临床获益的可能性越大。
  4. 该模型使用通过特征选择分析显著关联于临床获益的22个特征进行训练(补充图4b和补充表2)。
  5. 这两个模型的性能通过总体生存期的时间依赖性AUC(AUC(t))和临床获益的AUC进行评估。
  6. 有关机器学习系统的详细信息,请参阅方法部分。
Para_03
  1. 为了预测临床结果的主要分析,根据训练集中观察到的风险评分的第一和第三四分位数,将患者分为高风险、中等风险和低风险组(补充图5)。
  2. Cox比例风险回归检验了风险评分与总体生存率之间的关联,Fisher精确检验比较了三个风险组之间的临床获益率。
  3. 有关统计分析的详细信息,请参见方法部分。

Model performance in the internal test datasets

内部测试数据集上的模型性能

Para_01
  1. 在保留测试数据中,SCORPIO,一个用于预测总体生存期的机器学习模型,在接受免疫检查点抑制剂治疗后6、12、18、24和30个月时预测了总体生存期,整体癌症AUC(t)中位数为0.763(图2)。
  2. SCORPIO在预测总体生存期方面优于SCORPIO-CB和TMB,如AUC(t)值所示(补充图6a)。
  3. 它还预测了临床获益,整体癌症AUC为0.714,超过了SCORPIO-CB(整体癌症AUC为0.701)和TMB(整体癌症AUC为0.546;图2和补充图6b)。
  4. SCORPIO在所有癌症类型中始终优于SCORPIO-CB和TMB(补充图6和7)。

Fig. 2: Performance of SCORPIO across all real-world cohorts, phase 3 clinical trials and different tumor types.

  • Dot plot 总结了 SCORPIO 在预测 6、12、18、24 和 30 个月的总体生存率以及在三个真实世界队列和来自 10 项 III 期临床试验的 12 个实验臂中的临床效益方面的表现。
  • RWD,代表真实世界数据;RCT,代表随机对照试验。
  • a由于 MSHS 队列中缺乏临床效益数据,因此无法计算 AUC。
  • b由于所有患者在这个时间点前均已去世,因此无法计算 AUC(t)。
  • c由于所有患者在这个时间点仍然存活,因此无法计算 AUC(t)。
Para_02
  1. 为了确定癌症类型特定模型是否比SCORPIO(一个泛癌模型)提供了更好的预测价值,我们开发了基于每种癌症类型数据训练的模型。
  2. 首先,我们对每种癌症类型分别进行了特征选择分析和模型训练。
  3. 在训练集中17种癌症类型中,我们识别出10种与总体生存率显著相关的特征(补充表2)。
  4. 然后,我们训练了10个模型,并将它们在保留测试集中的性能与SCORPIO进行了比较。
  5. SCORPIO在预测总体生存率和临床获益方面优于大多数癌症类型特定模型(补充图8)。
  6. 这表明,在大量泛癌数据上训练的SCORPIO成功学习了跨癌症类型的关联关系。
Para_03
  1. 接下来,我们将SCORPIO的表现与Vanguri等人43提出的九种机器学习模型进行了比较,这些模型使用单一、双模或多种模式的数据(放射学、病理学、肿瘤遗传学和PD-L1评分)预测NSCLC患者的ICI疗效。
  2. SCORPIO在预测总体生存率方面优于这些模型(补充图9a),并且在预测临床获益方面表现相当,尽管它是基于更简单、更容易获取的泛癌数据进行训练的(补充图9b)。
Para_04
  1. 在保留测试数据中,三个风险组(低风险、中等风险和高风险)显示了显著不同的总体生存率(补充图10a)。
  2. 在各种肿瘤类型中,与高风险组相比,低风险组的死亡风险比(HR)为0.25(95%置信区间(CI),0.18-0.34),中等风险组的死亡风险比为0.48(95% CI,0.37-0.63)。
  3. 此外,在各种肿瘤类型中,每个风险组的临床获益率也显著不同——低风险组为55.96%,中等风险组为28.64%,高风险组为12.12%(P = 3.22 × 10^-11;补充图10b)。
Para_05
  1. 我们随后试图在独立的真实世界 MSK-II 队列中测试 SCORPIO。在这个队列中,SCORPIO 预测了免疫检查点抑制剂(ICI)后 6、12、18、24 和 30 个月的整体生存率,泛癌 AUC(t) 的中位数为 0.759(图 2)。它还预测了从 ICI 中获得临床效益的泛癌 AUC 为 0.641。
  2. 根据保留测试数据的结果,SCORPIO 在 AUC(t) 和 AUC 方面的表现优于基于 TMB(补充图 11 和 12)。
  3. 三个风险组的整体生存率有显著差异(图 3a 和补充图 13a)。
  4. 在各种肿瘤类型中,低风险组和中等风险组与高风险组相比的死亡风险比分别为 0.16(95% 置信区间,0.14-0.19)和 0.38(95% 置信区间,0.34-0.43)。
  5. 此外,在各种肿瘤类型中,每个风险组的临床效益率显著不同——低风险组,65.09%;中等风险组,52.20%;高风险组,32.89%(P = 2.35 × 10^-11;图 3b 和补充图 13b)。
  6. 在两个内部测试数据集中,风险组与临床结果之间的关联独立于 ICI 给药的治疗线数、性别、年龄、东部肿瘤协作组织体能状态(ECOG-PS)、微卫星不稳定性(MSI)状态和 TMB(补充图 14 和 15)。

Fig. 3: Performance of SCORPIO on the MSK-II cohort (internal test set).

image
  • Kaplan-Meier 图显示了根据 SCORPIO 分层的三个风险组的总体生存情况。标记表示删失数据。黑色虚线垂直线和水平线代表每个风险组的中位生存时间。使用对数秩检验计算了双侧P值。未应用多重检验校正。
  • 条形图显示了根据 SCORPIO 分层的三个风险组的临床获益率。使用Fisher精确检验计算了双侧P值。未应用多重检验校正。
Para_06
  1. 为了确定SCORPIO是否专门用于预测免疫检查点抑制剂(ICI)的疗效,还是普遍适用于癌症患者的整体生存预后,无论治疗方式如何,我们分析了MSKCC30中一组未接受ICI治疗的患者。SCORPIO能够在某些,但不是所有癌症类型中对非ICI患者的总体生存进行预后(补充图16)。然而,与ICI治疗背景下的情况相反,在特定癌症如膀胱癌(P = 0.2713)、肝胆管癌(P = 0.1038)、食道癌(P = 0.8886)和卵巢癌(P = 0.4305;图3a和补充图10a、13a以及16)中,其预后准确性有所下降。这些发现表明,SCORPIO在ICI治疗背景下更有效地预测总体生存。
  2. To determine whether SCORPIO is specifically prognostic for ICI efficacy or generally prognostic for patients with cancer regardless of treatment,

Model interpretability

模型可解释性

Para_01
  1. 为了理解每个特征如何对SCORPIO的风险评分预测做出贡献,我们使用SHapley Additive exPlanations (SHAP)方法分析了训练集中33个特征的相对影响。
  2. SHAP量化了每个特征对免疫检查点抑制剂(ICI)疗效患者间变异的贡献(图4a)。
  3. 贡献最大的前五个特征分别是氯化物(CL)、ALB、血红蛋白(HGB)、ECOG-PS和白细胞中嗜酸性粒细胞的比例(EOS%)。

Fig. 4: Model interpretability.

  • 全球模型解释使用SCORPIO特征的聚集SHAP值的点图。特征的负聚集SHAP值(黄色)越高,风险评分值越低,而特征的正聚集SHAP值(紫色)越高,风险评分值越高。特征按绝对聚集SHAP值排序。
  • WBC,白细胞;RBC,红细胞;AGAP,阴离子间隙;PROT,总蛋白;LYM%,白细胞中的淋巴细胞比例;NEUT%,白细胞中的中性粒细胞比例;吸烟史;NEUT,中性粒细胞计数;CREAT,肌酐;LYM,淋巴细胞计数;HCT,血细胞比容;GLU,葡萄糖;MONO,单核细胞计数;ALT,丙氨酸氨基转移酶;年龄,在ICIs时的年龄;AST,天冬氨酸氨基转移酶;MCHC,平均红细胞血红蛋白浓度;分期,在ICIs时的肿瘤分期;MLR,单核细胞与淋巴细胞比率;RDW,红细胞分布宽度;ALK,碱性磷酸酶;BASO%,白细胞中的嗜碱性粒细胞比例;eGFR,估算肾小球滤过率;PLT,血小板;BILI,总胆红素;BLR,嗜碱性粒细胞与淋巴细胞比率。
  • b-e,局部模型解释,(b和c)两个代表性案例分别对ipilimumab/nivolumab和atezolizumab产生完全反应,(d和e)两个代表性案例分别对atezolizumab和pembrolizumab产生疾病进展。每个案例用左面板的条形图表示,显示影响预测风险评分的每个特征的幅度和方向的聚集SHAP值。右面板显示治疗前后的放射影像。
  • 给定患者相应特征的特征值在条形图中提供。每个患者的最佳总体肿瘤反应和生存情况也显示出来。密度图显示训练集中风险评分的分布,黑色虚线指示每个患者的预测风险评分。
  • MSS,微卫星稳定。b和c中的黄色箭头分别指示免疫治疗扫描('Pre-ICI')中的肝脏和肺转移。相应的治疗后扫描('Post-ICI')显示完全反应,无可见病变。
  • d中的黄色线代表恶性胸腔积液在免疫治疗前后扫描中的双径直径,反映尽管治疗但病情仍在进展。e中的黄色虚线描绘了在ICI治疗期间新出现的恶性胸腔积液,表明病情进展。
  • f,g,热图显示14种免疫细胞类型与前五特征之间的关联,以及来自SCORPIO的预测风险评分(f)非小细胞肺癌患者和(g)头颈癌患者。
  • NK,自然杀伤细胞。使用Spearman等级相关检验计算双侧P值。

    • 错误发现率(FDR)调整后的P<0.05。** FDR调整后的P<0.01。每个单元格中的数字表示Spearman的ρ。
Para_02
  1. 图4b至e展示了来自保留测试集的不同风险评分和临床反应的代表性患者。
  2. 每个特征的贡献方向和大小基于其自身的值以及其它特征的值而变化,这显示了模型在预测每位患者的ICI疗效方面的复杂性。
Para_03
  1. 接下来,我们研究了前五种特征和预测风险评分如何反映肿瘤微环境(TME)的特性。
  2. 我们收集了一个额外的包含264名NSCLC患者的队列,这些患者有可用的bulk RNA测序(RNA-seq)、血液检测值(在肿瘤活检当天或不超过30天之前进行)和临床数据。
  3. 使用Danaher签名45(已验证为对NSCLC最准确的免疫细胞解卷积方法46),我们解卷积出14种免疫细胞类型。
  4. 然后,我们分析了这些细胞类型的丰度与前五种特征水平以及预测风险评分之间的相关性(图4f)。
  5. 我们的发现显示,较高的ALB水平与肥大细胞、T细胞、B细胞、CD45细胞和调节性T细胞的丰度增加有关。
  6. 相反,较低的ECOG-PS与T细胞、B细胞、CD45细胞、耗竭的CD8细胞和细胞毒性细胞的丰度增加有关。
  7. 此外,较低的预测风险评分(表明更好的免疫治疗反应预测)与肥大细胞、T细胞、B细胞、CD45细胞、调节性T细胞、自然杀伤CD56dim细胞和Th1细胞的丰度增加相对应。
  8. 我们进一步分析了14种免疫细胞类型的丰度与前五种特征水平以及预测风险评分之间的关联,这些患者来自MSK-I队列中的头颈癌(H&N)患者(n=32)(图4g)。
  9. 与NSCLC队列相比,显著关联较少,这可能是因为样本量较小。
  10. 然而,观察到非常相似的关系——各种免疫细胞类型与ALB水平呈正相关,而ECOG-PS和预测风险评分与许多免疫细胞类型呈负相关。
  11. 这些结果表明,SCORPIO中的某些特征反映了TME状态,并且低预测风险评分对应于患者的免疫炎症表型。
Para_04
  1. 我们还评估了前五个特征是否与TMB相关。使用来自多个MSKCC队列的患者(n = 2,969),我们发现TMB通常与前五个特征或风险评分无关,除了在少数几种癌症类型中(补充图17)。
  2. ,

Model performance in the external test datasets

外部测试数据集中的模型性能

Para_01
  1. SCORPIO 在 IMvigor211 试验(膀胱癌)中,在 6、12、18、24 和 30 个月预测总体生存率方面表现最佳,其中位 AUC(t) 为 0.782,同时在 IMspire150 试验(黑色素瘤)中预测临床获益,AUC 为 0.684(图 2)。
  2. 在每个临床试验队列中,三个风险组表现出显著不同的总体生存率(每项试验 P 值均小于 0.0001;图 5a)。
  3. 同样,临床获益率在不同风险组间也存在显著差异(P 值:IMpower133 为 0.043,IMpower131(ACNP)为 0.0027,IMpower131(ACP)为 0.001,IMpower150(ABCP)为 0.0004,IMspire150 和 OAK 为 0.0003,IMpower150(ACP)为 0.0001,其余试验 P 值小于 0.0001;图 5b)。
  4. 重要的是,这些结果与性别、年龄和 PD-L1 表达无关(补充图 18)。
  5. 在临床试验中,SCORPIO 在预测临床获益和总体生存率方面优于 PD-L1 染色,这由各种性能指标显示(补充图 19)。

Fig. 5: Performance of SCORPIO on the 10 global phase 3 clinical trial cohorts (external test sets).

image
  • Kaplan-Meier 图显示了根据 SCORPIO 分层的 10 个临床试验队列中的 12 个实验臂的三个风险组的整体生存率。刻度标记表示删失数据。黑色虚线垂直线和水平线代表每个风险组的中位生存时间。双侧 P 值使用对数秩检验计算得出。未进行多重检验校正。HCC 为肝细胞癌。
  • 条形图显示了根据 SCORPIO 分层的 10 个临床试验队列中的 12 个实验臂的三个风险组的临床获益率。双侧 P 值使用费舍尔精确检验计算得出。未进行多重检验校正。
Para_02
  1. 为了进一步测试模型的泛化能力,我们分析了一个在大型综合性医疗系统(MSHS)接受治疗的真实患者队列,该队列涵盖了多样化的患者群体。
  2. 在这个队列中,SCORPIO 在免疫检查点抑制剂(ICI)治疗后6、12、18、24和30个月预测了总体生存率,全癌种的平均曲线下面积(AUC(t))中位数为0.725(图2),并且在ICI给药后,三个风险组的总体生存率有显著差异(图6)。
  3. 在不同肿瘤类型中,与高风险组相比,低风险组和中等风险组的死亡风险比分别为0.25(95%置信区间,0.18-0.34)和0.41(95%置信区间,0.33-0.50)。
  4. 重要的是,所有这些结果都独立于ICI给药的治疗线数、性别、年龄和ECOG表现状态(补充图20)。

Fig. 6: Performance of SCORPIO on the MSHS cohort (external test set).

image
  • Kaplan-Meier 图显示了通过 SCORPIO 分层的三个风险组的总体生存率。标记表示删失数据。黑色虚线垂直线和水平线代表每个风险组的中位生存时间。使用对数秩检验计算了双侧 P 值。未应用多重检验校正。
  • Tick marks indicate censored data.
  • Black vertical and horizontal dashed lines represent the median survival time for each risk group.
  • Two-sided P values were calculated using the log-rank test.
  • Correction for multiple testing was not applied.

Model performance comparison across cohorts and tumor types

各队列和肿瘤类型的模型性能比较

Para_01
  1. SCORPIO 在大多数癌症类型的真实世界队列中预测总体生存率方面表现优于 III 期临床试验。
  2. 例如,在膀胱癌中,真实世界队列中的中位 AUC(t) 为 0.809(包括所有时间点和队列),超过了 IMvigor211 试验中的 0.782。
  3. 同样地,在肝胆癌中,真实世界数据中的中位 AUC(t) 达到 0.746,超过了 IMbrave150 试验中的 0.704。
  4. 值得注意的是,SCORPIO 在 RCC 的真实世界队列中表现出最强的性能,其中位 AUC(t) 为 0.829,高于 IMmotion151 试验中的 0.668。
Para_02
  1. 该模型在真实世界队列中的表现更好,可能是因为训练数据包含了更广泛患者特征、癌症类型和治疗环境。这也表明该模型有效地捕捉了在日常临床实践中发现的复杂性和变化性,增强了其在预测免疫检查点抑制剂在不同患者群体中疗效方面的适用性。
  2. 值得注意的是,该模型在预测总体生存率方面比预测大多数癌症类型和队列中的临床获益表现更好,这可能反映了总体生存率作为可靠临床终点的稳健性,在肿瘤学中通常因其明确且客观的结果而被优先考虑,相比之下,临床获益则不那么清晰和客观。
Para_03
  1. 此外,我们的分析显示SCORPIO在预测不同癌症类型临床获益方面表现不一(图2)。
  2. 为了理解性能在不同癌症类型之间的差异,我们将特定癌症类型的模型与SCORPIO的SHAP值进行了比较。
  3. 这一分析揭示了SCORPIO的泛癌建模方法可能忽略的关键特征。
  4. 我们的研究结果显示,在SCORPIO模型中,特定特征在不同癌症类型中的重要性存在一些变化(补充图21)。
  5. 例如,虽然SHAP分析表明ALB和HGB在SCORPIO中很重要,但在特定癌症类型的模型中它们的重要性有所降低,特别是在膀胱癌、卵巢癌、头颈癌和非小细胞肺癌中。
  6. 此外,与人乳头瘤病毒状态相关的病毒感染在头颈癌中相关,以及血小板计数在头颈癌和黑色素瘤中具有影响力,突显了每种癌症类型可能具有的独特生物学特性。
  7. 这些差异可能表明,SCORPIO的泛癌方法可能无法完全捕捉某些特征在特定癌症类型中的重要性。
  8. 然而,SCORPIO在预测总体生存率和临床获益方面优于特定癌症类型的模型,展示了其稳健性和普适性(补充图8)。
  9. 结合特定癌症特征的针对性改进可能会进一步提高SCORPIO在预测临床获益方面的准确性,平衡未来对普适性的需求与针对特定癌症类型的精确性要求。

Discussion

Para_01
  1. 存在一个重要的临床需求,即开发普遍可访问的生物标志物来预测患者对免疫检查点抑制剂(ICIs)的反应。
  2. 目前,全球范围内可用的基因组学和免疫学检测并不普及。
  3. 在这项研究中,我们描述了SCORPIO,这是一个机器学习模型,它依赖于常规血液检测和基本的临床数据,以更有效地预测免疫检查点抑制剂给药后的临床结果,比现有的FDA批准的生物标志物如TMB和PD-L1免疫组化更有效。
Para_02
  1. 我们的数据来自两个中心和10个全球三期临床试验,总计包含21种癌症类型的9,745名患者,这代表了迄今为止癌症免疫治疗领域最大的数据集。
  2. MSHS队列包括来自纽约市门诊中心具有不同背景的患者。
  3. 与MSKCC队列和临床试验队列相比,MSHS队列在种族、社会经济地位、合并症和健康素养方面更加多样化。
  4. 尽管存在这种多样性,我们发现在MSHS、MSKCC和临床试验队列之间得到了一致的结果。
  5. 重要的是,风险组分层是基于通用的临界值来预测患者的预后情况,这些临界值适用于各种癌症类型。
Para_03
  1. SCORPIO 在预测 ICI 效果方面优于 TMB 和 PD-L1 染色。
  2. PD-L1 免疫组织化学检测并非普遍可用,并且使用了各种平台、抗体和质量保证实践。
  3. TMB 估算需要资源密集型的基因组分析,而且由于基因组面板的大小、基因内容和生物信息学管道的差异,测量得到的 TMB 在不同基因组面板之间有所不同。
Para_04
  1. 我们的研究存在一些局限性。训练集是从MSKCC回顾性收集的几年内的一些病例,导致某些癌症类型如非小细胞肺癌、黑色素瘤、膀胱癌和肾细胞癌的患病率较高。
  2. 尽管如此,我们证明了该模型能够在来自另一家医疗机构和全球临床试验的多个外部数据集中预测临床获益和生存。
  3. 这些外部数据集的多样性引入了异质性,但也证实了模型的普适性。
  4. 然而,该模型在‘其他’组中包含的较少见癌症类型的性能应在更大规模的数据集上进一步测试。
Para_05
  1. 尽管SCORPIO在各种队列中对总体生存的预测保持了一致的表现,但它预测免疫检查点抑制剂临床获益的能力在不同癌症类型和队列之间有所不同。
  2. 这一发现表明,SCORPIO在生存预后方面是可靠的,但在准确预测临床获益方面面临挑战。
Para_06
  1. 在临床终点方面,总体生存期通常被认为是评估肿瘤治疗效果最可靠和客观的指标,在肿瘤学中被广泛采用,并且是监管机构在批准新抗癌药物时使用的关键指标。
  2. 贝伐珠单抗在转移性乳腺癌中的案例突显了这一点,因为它最初基于无进展生存期的批准后来被撤销,原因是缺乏总体生存期的改善。
  3. 鉴于SCORPIO对总体生存期具有很强的预测性能,我们得出结论,它在患者接受免疫检查点抑制剂(ICI)药物治疗时能够有效地提供关于患者生存的预后见解。
  4. 在预测肿瘤反应方面,SCORPIO的表现较为温和,这在免疫治疗特别是ICI治疗背景下是可以预期的,因为肿瘤反应与患者生存之间的联系可能较弱,受到诸如假性进展、延迟反应以及出现新的病灶随后产生反应等因素的影响。
  5. Kaufman等人的一项荟萃分析发现,8项随机试验中有75%(6/8)显示ICI药物改善了总体生存期但没有改善无进展生存期,这凸显了总体生存期与诸如无进展生存期或客观缓解率等替代终点之间的关系较弱。
  6. 尽管如此,评估诸如肿瘤反应等替代指标,结合总体生存期,可以更全面地理解治疗效果,包括早期的抗肿瘤活性信号。
  7. SCORPIO未来的版本将提供对诸如肿瘤反应等替代指标以及总体生存期的改进预测,随着更多数据的获得。
Para_07
  1. 尽管存在局限性,SCORPIO 仍然是一个高度可访问的模型,用于预测 ICI 的疗效,并且可以在与其他评估(如 TMB、PD-L1 染色和 MSI 状态)结合使用时辅助临床决策。
  2. 它可以帮助在 ICI、细胞毒性疗法和靶向疗法之间优先选择治疗方案,评估对ICI有免疫相关不良事件风险的患者的利弊,通过选择或富集可能从ICI中获益更多或更少的患者来指导临床试验设计。
Para_08
  1. 总之,我们开发并测试了SCORPIO,这是一种用于预测接受免疫检查点抑制剂治疗的癌症患者预后的机器学习模型。
  2. SCORPIO的关键优势在于它在所有实践环境中均可使用,包括低资源医疗环境。
  3. SCORPIO中的所有特征都是全球医院和诊所常规收集的数据,并且可以通过患者的临床记录访问,这使得我们的方法无创、成本效益高并且在全球范围内可访问。
  4. 需要进一步的研究来前瞻性地验证我们的模型在各种临床环境中的应用。

Methods

Ethics approval

伦理批准

Para_01
  1. 研究方案得到了西奈山伊坎医学院和MSKCC机构审查委员会的批准,并且所有患者均签署了知情同意书。

Cohorts description

队列描述

Cohort description for MSK-I cohort

MSK-I队列的队列描述

Para_01
  1. 我们回顾性地建立了一个真实世界队列,该队列包含从2014年到2019年在MSKCC接受至少一剂ICI治疗的3,278名患者(补充图2a)。
  2. 我们排除了818名有多于一种癌症病史的患者,26名参与盲法试验的患者,115名癌症类型少于25例的患者,以及184名临床或实验室数据不充分的患者。
  3. 此外,我们还排除了100名在新辅助或辅助环境中接受ICI治疗的患者。
  4. 因此,MSK-I队列由来自17种不同癌症类型的2,035名患者组成(扩展数据表1)。
  5. 在这2,035名患者中,中位年龄为63.50岁(四分位距54.77-70.92岁),其中1,164人(57.20%)为男性。
  6. 在所有患者中,638人(31.35%)作为一线疗法接受了ICI治疗。
  7. 最常见的癌症类型是:非小细胞肺癌(n=666,32.73%),肾细胞癌(n=229,11.25%),黑色素瘤(n=210,10.32%),头颈癌(n=168,8.26%)和膀胱癌(n=111,5.45%)(补充图1a)。

Clinical features for MSK-I cohort

MSK-I队列的临床特征

Para_01
  1. 所有特征及其单位的详细描述见补充表1。
  2. 收集了两个特征用于人口统计数据(年龄和性别),八个特征用于临床数据(BMI、药物类别、免疫治疗期间的化疗、系统治疗史(PreChemo)、ECOG-PS、吸烟史、肿瘤分期和病毒感染)。
  3. 从血液检查中,最初收集了47个特征:17个特征来自综合代谢面板(CMP;白蛋白、碱性磷酸酶、丙氨酸氨基转移酶、阴离子间隙、天冬氨酸氨基转移酶、尿素氮、钙、氯、二氧化碳、肌酐、估算肾小球滤过率(eGFR)、葡萄糖、钾、胆红素、总蛋白、镁和磷),21个特征来自全血细胞计数(CBC;白细胞(WBC)计数、嗜碱性粒细胞计数、嗜酸性粒细胞计数、粒细胞计数、淋巴细胞计数、单核细胞计数、中性粒细胞计数、WBC中的嗜碱性粒细胞比例、EOS%、WBC中的粒细胞比例、WBC中的淋巴细胞比例、WBC中的单核细胞比例、WBC中的中性粒细胞比例、血细胞比容、HGB、平均红细胞血红蛋白浓度、平均红细胞血红蛋白、平均红细胞体积、血小板、红细胞和红细胞分布宽度),3个特征来自凝血面板(活化部分凝血活酶时间、国际标准化比率和凝血酶原时间)、结合胆红素、直接胆红素、葡萄糖-6-磷酸脱氢酶、离子钙、乳酸脱氢酶和脂肪酶。
  4. 其中,13个特征因队列中患者缺失值≥70%,被移除后续分析:2个特征来自CMP(镁和磷),2个特征来自CBC(粒细胞计数和WBC中的粒细胞比例),以及凝血面板的所有特征(活化部分凝血活酶时间、国际标准化比率和凝血酶原时间)、结合胆红素、直接胆红素、葡萄糖-6-磷酸脱氢酶、离子钙、乳酸脱氢酶和脂肪酶。
Para_02
  1. 然后,手动计算了四种免疫细胞与淋巴细胞的比例,分别是每种免疫细胞类型的绝对数量除以淋巴细胞的绝对数量:嗜碱性粒细胞与淋巴细胞比率、嗜酸性粒细胞与淋巴细胞比率、单核细胞与淋巴细胞比率和NLR。上述免疫细胞与淋巴细胞的比例被视为CBC的一部分。
  2. The above immune cell-to-lymphocyte ratios were considered as part of the CBC.
Para_03
  1. 总共有来自四种数据模态的48个特征:人口统计学(n = 2),临床(n = 8),CMP(n = 15)和CBC(n = 23)。
  2. 所有临床特征均在首次免疫检查点抑制剂(ICI)输注前收集(在首次ICI输注当天或不超过30天之前进行收集)。
  3. 对于eGFR,报告结果时不调整种族。
  4. 肿瘤在ICI给药时根据美国癌症联合委员会第八版指南(60号指南)进行了分期(除原发性中枢神经系统(CNS)恶性肿瘤外,这些肿瘤未进行分期)。
Para_04
  1. MSK-IMPACT31 靶向基因测序检测中的 TMB 数据可用,该检测方法已获 FDA 批准用于肿瘤分析。
  2. TMB 被定义为每兆碱基(mut/Mb)的体细胞非同义突变总数。
  3. 对于亚组分析,TMB ≥ 10 的患者被定义为 TMB 高组,而 TMB < 10 的患者被定义为 TMB 低组。
  4. 使用 MSIsensor61 评估 MSI 状态,标准如下:稳定(0 ≤ MSI 分数 < 3),不确定(3 ≤ MSI 分数 < 10)和不稳定(MSI 分数 ≥ 10)。
Para_05
  1. 在进行特征选择和训练机器学习算法之前,我们使用缺失py包(版本0.2.0)中的MissForest62方法用默认参数(max_iter=10,decreasing=False,missing_values=np.nan,copy=True,n_estimators=100,criterion=('mse','gini'),max_depth=None,min_samples_split=2,min_samples_leaf=1,in_weight_fraction_leaf=0.0,max_features='auto',max_leaf_nodes=None,min_impurity_decrease=0.0,bootstrap=True,oob_score=False,n_jobs=-1,random_state=None,verbose=0,warm_start=False,class_weight=None)填补MSK-I队列中的缺失值。我们使用Python 3.8.8(https://www.python.org/)。每位患者的48个特征平均有0.70个缺失值。
  2. 在填补缺失值后,我们随机将MSK-I队列按80:20的比例分为训练集(n = 1,628)和保留测试集(n = 407)。为了防止训练集和保留测试集之间模型性能可能存在的潜在偏差,我们在训练集和保留测试集中保持了肿瘤反应、癌症类型和系统治疗史的相同分布。
  3. 通过R编程语言版本4.1.1(https://www.r-project.org/)中的dplyr(版本1.1.4)和tidyverse(版本2.0.0)包中的group_by和sample_frac函数来分割训练集和保留测试集。

Cohort description for MSK-II cohort

MSK-II队列的队列描述

Para_01
  1. 我们回顾性收集了另外一组真实世界队列,该队列包含2011年至2020年期间在MSKCC接受至少一剂ICI治疗的3,159名患者,以进一步在内部测试我们的模型。这些患者是从一个比MSK-I队列更广泛的时间段内捕获的,并且是同时期未进行肿瘤基因组测序的患者(补充图2b)。
  2. 我们排除了660名有多于一种癌症病史的患者,14名参加盲法试验的患者,65名患有少于10例的癌症类型的患者,以及184名临床或实验室数据不充分的患者。
  3. 此外,我们还排除了132名在新辅助或辅助环境中接受ICI治疗的患者。
  4. 因此,MSK-II队列由19种癌症类型的2,104名患者组成(扩展数据表1和补充图2b)。
  5. 在这2,104名患者中,中位年龄为67.13岁(四分位间距58.59-74.33岁),其中1,180人(56.08%)为男性。
  6. 总体而言,1,189名患者(56.51%)接受了ICI作为一线治疗。
  7. 最常见的癌症类型包括:非小细胞肺癌(n=755,35.88%);膀胱癌(n=156,7.41%);肾细胞癌(n=154,7.32%);黑色素瘤(n=151,7.18%)和小细胞肺癌(n=137,6.51%)(补充图1d)。

Clinical features of MSK-II cohort

MSK-II队列的临床特征

Para_01
  1. 对于MSK-II队列,收集了SCORPIO所需的四种数据模态:人口统计学(n = 1),临床(n = 4),CMP(n = 11)和CBC(n = 17)(有关SCORPIO所需的33个特征的详细信息,请参见‘特征选择分析’部分)。
  2. 除肿瘤分期外,所有临床特征均被检索(在首次ICI输注日期或首次ICI输注日期前不超过30天内进行)。
  3. 肿瘤在诊断时根据美国癌症联合委员会第八版指南进行分期(原发性CNS恶性肿瘤除外,这些肿瘤未进行分期)。
  4. 对于eGFR,报告结果时不调整种族。
  5. 在MSK-II队列中,934名患者(44.39%)接受了MSK-IMPACT测序,因此只有这一部分患者的TMB数据可用。
  6. 对于亚组分析,将TMB ≥ 10的患者定义为TMB-High组,而TMB < 10的患者定义为TMB-Low组。
  7. 使用MSIsensor评估MSI状态,标准如下:稳定(0 ≤ MSI评分 < 3),不确定(3 ≤ MSI评分 < 10)和不稳定(MSI评分 ≥ 10)。
  8. 所有临床特征均被检索(在首次ICI输注日期或首次ICI输注日期前不超过30天内进行)。
Para_02
  1. 我们使用缺失py包中的MissForest方法,默认参数下,在将该队列与训练集合并为一个数据帧后填补了缺失值。
  2. 每个患者平均缺失的变量数量在33个特征中为0.57个。

Cohort description for MSK non-ICI cohort

MSK非ICI队列的队列描述

Para_01
  1. 对于非ICI的MSK队列,从之前的一项研究中获得了6,629名未接受ICI治疗的患者(扩展数据表4)。
  2. 该队列的中位年龄为61.15岁(四分位距50.83-69.55岁),其中2,912人(43.93%)为男性。
  3. 最常见的癌症类型是NSCLC(n=1,160,17.50%)、结直肠癌(n=1,124,16.96%)、乳腺癌(n=820,12.37%)、胰腺癌(n=753,11.36%)和肉瘤(n=541,8.16%)。

Clinical features of MSK non-ICI cohort

MSK非ICI队列的临床特征

Para_01
  1. 对于MSK非ICI队列,收集了SCORPIO所需的四种数据类型:人口统计学(n = 1),临床(n = 4),CMP(n = 11)和CBC(n = 17)。
  2. 所有临床特征均在诊断时收集。
  3. 肿瘤也在诊断时根据美国癌症联合委员会第八版指南进行分期(原发性中枢神经系统恶性肿瘤除外,这些肿瘤未进行分期)。
  4. 对于eGFR,报告结果时不调整种族。
Para_02
  1. 我们使用缺失py包中的MissForest方法,用默认参数将该队列与训练集合并到一个数据帧中后,填补了缺失值。
  2. ,

Cohort description for MSHS cohort

MSHS 队列描述

Para_01
  1. 一个额外的回顾性真实世界队列来自MSHS,用于测试我们的框架在不同医疗环境中的预后能力是否具有普适性(补充图2c)。
  2. 在MSHS队列中,我们确定了2011年至2019年间接受至少一剂ICI治疗的1,230名患者。
  3. 我们排除了一名参与盲法试验的患者、26名因血液恶性肿瘤接受ICI治疗的患者、16名癌症类型少于10例的患者以及28名临床或实验室数据不充分的患者。
  4. 因此,MSHS队列由18种癌症类型的1,159名患者组成(扩展数据表1)。
  5. 在1,159名患者中,中位年龄为66.84岁(四分位间距58.92-74.38岁),其中691人(59.62%)为男性。
  6. 在总计患者中,551人(47.54%)作为一线疗法接受了ICI治疗。
  7. 最常见的癌症类型是肝胆癌(n = 304,26.23%)、非小细胞肺癌(n = 281,24.25%)、黑色素瘤(n = 128,11.04%)、头颈癌(n = 94,8.11%)和膀胱癌(n = 66,5.69%)(补充图1e)。

Clinical features of MSHS cohort

MSHS队列的临床特征

Para_01
  1. 对于MSHS队列,收集了四种数据模态以满足SCORPIO的要求:人口统计学(n = 1),临床(n = 4),CMP(n = 11)和CBC(n = 17)。
  2. 所有临床特征均从首次免疫检查点抑制剂(ICI)输注日期或该日期前不超过30天内获取。
  3. 对于估算肾小球滤过率(eGFR),报告结果时不进行种族调整。
  4. 对1,159名患者的以下记录进行了人工审查以验证临床数据:ECOG体能状态(PS)、癌症类型、肿瘤分期、吸烟史、药物类型和系统治疗史。
  5. 肿瘤在ICI给药时根据美国癌症联合委员会第八版指南(美国癌症联合委员会第六十版)进行分期(原发性中枢神经系统恶性肿瘤除外,这些肿瘤未进行分期)。
  6. 我们将此队列与训练集合并为一个数据框后,使用missingpy包中的MissForest方法默认参数填充缺失值。
  7. 每位患者平均有1.94个缺失变量,分布在33个特征中。

Outcomes in real-world cohorts

真实世界队列的结果

Para_01
  1. 总体生存期从首次免疫检查点抑制剂(ICI)输注到因任何原因死亡进行计算,存活至审查时间的患者在最后一次联系时被删失。对于接受多次ICI治疗的患者,在分析中使用了第一次治疗的开始日期。
  2. 在MSK-I队列中,所有患者都有临床获益和总体生存期数据。在MSK-II队列中,所有患者都有总体生存期数据,但只有934名患者(44.39%)有临床获益数据。
  3. 对于MSK非ICI和MSHS队列,只有总体生存期数据可用。主要的临床结果是ICI后的临床获益和总体生存期。
  4. 临床获益根据RECIST v1.1标准进行分类(参考文献36)。如果缺少正式的RECIST评估,则由医师研究人员手动审阅医生笔记和影像学研究,以使用相同的标准基于目标病灶直径总和的变化来分类每位患者的总体最佳反应。
  5. 完全缓解(CR)、部分缓解(PR)和疾病稳定(SD)≥6个月被分类为临床获益,而SD<6个月和疾病进展(PD)则被分类为无临床获益。
  6. 使用临床获益作为治疗效果结果的理由来源于癌症免疫治疗背景下的系统性综述,这些综述表明,SD≥6个月的患者与肿瘤反应被分类为轻微PR的患者具有相似的总体生存期结果,而SD<6个月的患者与经历PD的患者具有更相似的总体生存期结果35。

Cohort description for clinical trial cohorts

临床试验队列的队列描述

Para_01
  1. 我们获得了10项第三期临床试验以进行进一步的外部测试:IMbrave150(n = 279)、IMspire150(n = 256)、IMmotion151(n = 445)、IMvigor211(n = 447)、IMpower133(n = 197)、IMpower130(n = 467)、IMpower131(n = 680)、IMpower132(n = 288)、IMpower150(n = 793)和OAK(n = 595)(扩展数据表2和3及补充图3)。
  2. 这10个队列中有六种不同的癌症类型:肝细胞癌(IMbrave150)、BRAFV600E阳性黑色素瘤(IMspire150)、RCC(IMmotion151)、膀胱癌(IMvigor211)、SCLC(IMpower133)和NSCLC(IMpower130、IMpower131、IMpower132、IMpower150和OAK)。患者特征见扩展数据表3。
Para_02
  1. 八项临床试验中,至少有一种附加药物与阿特珠单抗(抗PD-L1)联合使用:1)阿特珠单抗与贝伐珠单抗联合用于IMbrave150,2)阿特珠单抗与维莫非尼和考比替尼联合用于IMspire150,3)阿特珠单抗与贝伐珠单抗联合用于IMmotion151,4)阿特珠单抗与卡铂和依托泊苷联合用于IMpower133,5)阿特珠单抗与卡铂和白蛋白结合型紫杉醇(nab-紫杉醇)联合用于IMpower130,6)阿特珠单抗与卡铂和nab-紫杉醇或紫杉醇(ACNP或ACP)联合用于IMpower131,7)阿特珠单抗与培美曲塞和卡铂或顺铂联合用于IMpower132,8)阿特珠单抗与卡铂和紫杉醇联合使用或不使用贝伐珠单抗(ABCP或ACP)用于IMpower150。
  2. 两项临床试验中仅使用了阿特珠单抗:IMvigor211和OAK。
  3. 所有分析均基于意向治疗原则进行。
  4. 因此,12个实验组接受了外部测试分析(扩展数据表3)。

Clinical features of clinical trial cohorts

临床试验队列的临床特征

Para_01
  1. 所有基线实验室检测结果的患者都被分析了(来自罗氏提供的实验室检测文件中LBBLFL列带有"Y"标志的结果)。
  2. 对于临床试验数据,我们在将每个队列与训练集合并成一个单一的数据框后,使用missingpy包中的MissForest方法用默认参数填补缺失值。
  3. 在SCORPIO使用的33个特征中,eGFR、平均红细胞血红蛋白浓度和红细胞分布宽度对所有临床试验队列均不可用。
  4. 吸烟史对IMspire150和IMmotion151不可用。
  5. 此外,总蛋白对IMspire150也不可用。
  6. 每个临床试验中每名患者的33个特征的平均缺失值数量如下:IMbrave150为3.50,IMspire150为5.30,IMmotion151为4.84,IMvigor211为3.48,IMpower133为3.54,IMpower130为3.45,IMpower131为3.31,IMpower132为3.44,IMpower150为3.28,OAK为3.35。
Para_02
  1. 在临床试验队列中,使用SP142或SP263克隆(Ventana Medical Systems)进行的PD-L1免疫染色结果是可用的。
  2. IMbrave150和IMpower133有SP263克隆的数据,其余临床试验有SP142克隆的数据。
  3. IMbrave150、IMmotion151(只有IC的原始值可用)、IMpower133、IMpower130、IMpower131、IMpower132、IMpower150和OAK的免疫细胞(IC)或肿瘤细胞(TC)的原始PD-L1免疫染色值是可用的。
  4. IMspire150和IMvigor211没有IC和TC的原始PD-L1染色值,但基于PD-L1染色水平的分类组信息是可用的(IC0/1/2/3和TC0/1/2/3)。
  5. 为了根据PD-L1表达水平对患者进行分类,我们在具有NSCLC的临床试验(IMpower130、IMpower131、IMpower132、IMpower150和OAK;PD-L1表达在≥50%的TC或≥10%的IC(PD-L1-High组)以及<50%的TC和<10%的IC(PD-L1-Low组))和膀胱癌(IMvigor211;PD-L1表达在≥5%的IC(PD-L1-High组)以及<5%的IC(PD-L1-Low组))中应用了FDA批准的截止值。
  6. 在没有FDA批准的截止值的癌症类型中,我们使用了原始出版物中的相同标准:IMbrave150(PD-L1表达在≥1%的TC或≥1%的IC(PD-L1-High组)以及<1%的TC和<1%的IC(PD-L1-Low组))20,IMspire150(PD-L1表达在≥1%的IC(PD-L1-High组)以及<1%的IC(PD-L1-Low组))21,IMmotion151(PD-L1表达在≥1%的IC(PD-L1-High组)以及<1%的IC(PD-L1-Low组))22和IMpower133(PD-L1表达在≥5%的TC或≥5%的IC(PD-L1-High组),≥1%的TC或≥1%的IC(PD-L1-Mid组),以及<1%的TC和<1%的IC(PD-L1-Low组))24。

Outcomes in clinical trial cohorts

临床试验队列的结果

Para_01
  1. 总体生存期定义为从随机化到因任何原因死亡的时间。在最后随访时仍然存活的患者被删失。
  2. 对于临床获益,我们使用研究者确认的最佳总体反应。完全缓解(CR)、部分缓解(PR)和疾病稳定(SD)≥6个月被分类为临床获益,而SD<6个月和疾病进展(PD)被分类为无临床获益。
  3. 在临床试验方案中,未进行基于RECIST v1.1评估的基线后影像学检查(数据缺失、不可用(NA)或未评估(NE))的患者被分类为非响应者,在此分析中被归类为无临床获益组。

Machine learning model construction

机器学习模型构建

Feature selection analysis

特征选择分析

Para_01
  1. 在MSK-I队列中,68.65%的患者(n = 1,397)在接受免疫检查点抑制剂(ICI)治疗前接受了全身治疗作为一线治疗。
  2. 由于用于全身治疗的药物可能会影响血液细胞计数的测量、代谢组成或BMI,因此首先调查了全身治疗史的影响。






请到「今天看啥」查看全文