早筛网讯:
近日,来自丹麦的研究团队发表了一项肺癌检测研究,通过分析标准血检结果和吸烟状况,开发了一个基于动态集成选择(DES)的机器学习模型,该模型在检测肺癌方面表现出比肺科医生检测更高的灵敏度和特异性。研究发表在《scientific reports》上。
研究包括了
利用了丹麦大量高危人群的标准血液样本分析和吸烟史数据,包括有9940名符合条件的样本,有2505名(25%)被诊
断出患有肺癌,其余7435名(75%)没有肺癌。肺癌患者的中位年龄为74岁,非肺癌患者为71岁。2%的数据(200个样本)被保留作为测试集,用于与五位肺科专家的诊断进行比较。这五位肺科专家在内部医学部门工作,拥有10至20年的经验,他们仅根据实验室结果、年龄、性别和吸烟数据对200个病例进行评估。剩余的98%的数据(9740个样本)用于模型的训练和验证。通过2折交叉验证技术进行超参数调整,以确定最佳配置。模型训练采用了分层5折交叉验证方法,确保训练和验证集保持与整个队列相同的肺癌和非肺癌病例比例。
研究中训练了四种分类算法,包括逻辑回归、极端梯度提升(Extreme Gradient Boosting, XGBoost)、轻量梯度提升机(Light Gradient Boosting Machine, LGBM)和支持向量机(Support Vector Machine, SVM)。这些模型通过等温回归或Sigmoid校准,以实现最低的Brier分数,确保更准确的校准。校准后,四个模型被组合成一个DES模型,利用每个模型的优势。
研究结果显示,DES模型在验证集上
实现了0.77±0.01的ROC曲线下面积(AUC),灵敏度为76.2%±2.04%,特异性为63.8%±2.3%,阳性预测值为41.6%±1.2%,F1分
数为53.8%±1.0%。
五位肺科专家对200个样本的诊断结果显示,
平均灵敏度为67.4%,特异性为70.3%。
在相同的特异性水平下,DES模型展现出更高的灵敏度,为73.8%。
使用 5 倍交叉验证的验证集的评估指标比较
同
时,在200个样本中,DES模型和肺科专家对肺癌各阶段的正确预测分布也进行了比较。分析显示,肺科专家在诊断第Ⅱ期和第Ⅳ期肺癌患者方面表现优异,而模型在第Ⅰ和第Ⅲ期肺癌的诊断上超越了专家。
整体来看,机器学习模型在肺癌早期检测中有巨大的潜力,还突出了将临床和实验室数据整合到风险评估模型中的重要性,提高决策制定的质量,并促进及时的转诊,为肺癌的早期检测和治疗提供了更多思路和方法。
进群、合作、投稿请扫码: