基于深度学习影像组学在食管癌的研究进展

放射学实践 · 公众号 · 医学 · 2024-09-14 19:57

主要观点总结

基于深度学习的影像组学在食管癌（EC）诊断、治疗反应预测、淋巴结转移评估等方面展现了巨大潜力。深度学习通过自动提取肿瘤特征并结合临床数据提高诊断准确性，克服了传统影像学检查的局限性。在食管癌领域，深度学习可应用于早期病变检测、淋巴结转移状态评估、病理分化预测、治疗效果预测、无症状生存期和总生存期预测以及放疗计划制订。尽管深度学习在影像组学领域取得显着进展，但仍面临自动分割算法不够成熟、数据差异协调、参数调整复杂等问题。未来研究需优化自动分割算法、建立高质量公共数据库、简化参数调整等，以推动深度学习在临床上的实际应用。

关键观点总结

关键观点1: 深度学习在食管癌影像组学中的应用

深度学习在食管癌诊断、治疗反应预测、淋巴结转移评估等方面展现了巨大潜力，通过自动提取肿瘤特征并结合临床数据提高诊断准确性。

关键观点2: 深度学习在食管癌领域的具体应用

深度学习可应用于早期病变检测、淋巴结转移状态评估、病理分化预测、治疗效果预测、无症状生存期和总生存期预测以及放疗计划制订。

关键观点3: 深度学习在影像组学领域的挑战与未来展望

尽管深度学习在影像组学领域取得显着进展，但仍面临自动分割算法不够成熟、数据差异协调、参数调整复杂等问题。未来研究需优化自动分割算法、建立高质量公共数据库、简化参数调整等，以推动深度学习在临床上的实际应用。

正文

【摘要】食管癌（ EC ）是全球发病率和死亡率排名前列的肿瘤，影像学检查是 EC 临床分期、疗效评估以及预后判断的主要方法，但传统影像学检查的诊断准确性不高。近年来发展起来的影像组学方法在上述领域具有重要价值，深度学习在医学领域的应用进一步推动了影像组学技术的发展。本文对基于深度学习的影像组学在 EC 中的应用进展进行综述。

【 关键词 】食管癌；深度学习；影像组学；体层摄影术， X 线计算机；磁共振成像

【 中图分类号 】 R735.1 ； R814.42 ； R445.2

食管癌（ esophageal carcinoma ， EC ）在中国的发病率位居癌症的第六位，其中 95.5% 为鳞状细胞癌（ esophageal squamous cell carcinoma ， ESCC ） ^[1] 。 EC 患者早期症状隐匿，且 EC 具有高浸润性和淋巴结跳跃性转移的特点，中晚期时可能导致食管梗阻，病灶的浸润和转移严重影响患者的生活质量和生存预后。实现早期诊断和个体化精准治疗是提高 EC 患者五年生存率的关键 ^[2] 。

传统影像学检查依赖于放射科医师的人工判读，而医师间专业知识的差异可导致一定的漏诊和误诊率。此外，医师的视觉评估无法观察到肿瘤的异质性，而影像组学技术的发展为解决这些困境提供了新的机遇和方法 ^[3] 。

影像组学是一种对肿瘤表型进行定量分析和预测的方法，结合机器学习（ machine learning, ML ）技术将肿瘤特征与患者的临床和病理数据进行相关性分析，可提高诊断或预测的准确性 ^[4] 。影像组学可分为两大类：传统影像组学，也称为手工影像组学（ handcrafted radiomics, HCR ）和基于深度学习的影像组学（ deep learning-based radiomics, DLR ）。

HCR 研究在 EC 领域已经得到广泛开展 ^[5] ，其工作流程可以归纳为以下几个步骤：（ 1 ）图像采集和重建；（ 2 ）图像分割和 ROI 勾画（半自动或手动描绘）；（ 3 ）特征提取和量化；（ 4 ）面向临床任务模型的建立与验证。然而， HCR 存在 ROI 绘制的标准化程度低、特征提取及降维等步骤繁琐耗时等问题。此外，使用由数学公式定义的影像组学特征（包括形状、纹理和强度特征）较易受到噪声的影响，鲁棒性不足。

近年来，深度学习（ deep learning, DL ）作为一种极具潜力的医学图像分析技术逐步受到了广泛关注 ^[6] 。 DL 是 ML 的分支，指的是一大类算法而不是特定的模型，这类算法以神经网络为基础对量化数据进行特征学习。一些研究者在影像组学研究中结合了 DL 的优势，开发了 DLR ^[7] ，以解决 HCR 研究的局限性 ^[8] 。如，使用医学成像领域中最流行的 DL 算法之一的卷积神经网络（ cable news network, CNN ），从医学图像中自动检测和分割病灶，或者从完整图像中直接提取百万数量级的特征，并自动学习代表性特征，可轻松构建端到端的预测模型，避免了需由人工参与以及繁琐的特征提取和降维过程。

影像组学在 EC 中的应用

1 、 EC 自动检测

提高 EC 患者生存期的关键是早期诊断， HCR 在这一领域无法发挥作用，采用 DLR 的相关研究也较少。 Takeuchi 等 ^[9] 使用微调的 VGG16 网络架构构建了基于 CT 图像自动检测食道癌病灶的 DLR 模型，其诊断符合率为 84.2% ，敏感度和特异度分别为 71.7% 和 90.0% 。 Sui 等 ^[10] 使用了改进的 V-Net 网络架构从胸部 CT 平扫图像中对食管进行感兴趣区体积分割，然后通过计算食管内各点的平均边界距离对食管厚度进行评估，从而判断是否存在 EC 。该 DLR 模型实现了 88.8% 的敏感度和 90.9% 的特异度，可以基于胸部 CT 平扫图像有效检测 EC ，尤其是偶发早期 EC 患者。

2 、评估淋巴结转移状态

淋巴结转移情况是 EC 患者临床分期的重要依据，影响临床治疗方案的选择。然而，传统影像学方法是基于淋巴结的大小（短轴直径 10mm ）来判断是否为转移性淋巴结，但其诊断符合率较低（仅约 53% ） ^[11] ，由此可见，传统影像学诊断方法在判断淋巴结是否发生转移方面存在天然缺陷。因此，临床上亟需新的成像标志物来准确判断淋巴结转移状态。

Chen 等 ^[12] 使用 ResNet50 网络架构进行迁移学习，从淋巴结的 CT 图像中提取了 1000 个 DL 特征，随后进行特征降维后分别建立支持向量机（ support vector machine ， SVM ）、自适应增强（ Adaboost ）以及随机森林（ random forest ， RF ）分类模型。在测试集中，以 RF 模型在预测淋巴结转移时的效能最佳（ AUC=0.80 ）。在另一项研究中， Wu 等 ^[13] 进一步发挥 DL 的优势，使用基于 DL 算法的 CNN-F 网络架构从 EC 病灶的 CT 图像中提取组学特征，分别构建 HCR 、计算机视觉和 DLR 模型来预测 ESCC 患者的淋巴结转移状态，随后构建了多个联合模型，包括模型 1 （ HCR+CT 报告淋巴结转移状态）、模型 2 （模型 1+ 计算机视觉）和模型 3 （模型 2+DLR ），并对模型的预测效能进行比较，结果显示，包含有 DLR 的模型 3 在所有队列（训练、内部验证和外部验证）中均表现出最佳的鉴别效能（ AUC 分别为 0.875 、 0.874 和 0.840 ）。

3 、预测病理分化

尽管 ESCC 术后病理检查显示的肿瘤细胞分化情况不能直接影响患者治疗方案的选择，但可以对患者进行危险分层，这对于临床指导临床个体化精准治疗和预测患者的预后至关重要。 Kawahara 等 ^[14] 的研究中将 ESCC 的患者分为低分化和中高分化两组，并从放疗计划的 CT 扫描图像中提取了肿瘤和瘤周 5mm 范围的手工影像组学特征，并应用了基于 DL 架构的分类器来构建预测低分化 ESCC 的模型，模型在测试集中的 AUC 达到了 0.92 ，表明预测效能较好。

4 、预测治疗效果

肿瘤的异质性导致其对单独放疗（ radiotherapy, RT ）、同步化放疗（ concurrent chemoradiation ， CCRT ）、新辅助化疗（ neoadjuvant chemotherapy ， NAC ）和新辅助化疗放疗（ neoadjuvant chemoradiation treatment ， NCRT ）等治疗方法的反应存在差异，准确预测肿瘤对治疗的反应对于患者个性化治疗方案的制订具有重要意义，这是目前 EC 领域的热门研究方向之一。

Hou 等 ^[15] 从 68 例接受 CCRT 治疗患者的 MRI 图像上提取了 EC 病灶的手工影像组学特征，分别构建 SVM 模型和 DL 模型以预测治疗反应。结果显示， DL 模型的 AUC 达 0.883 ，与 SVM 模型的诊断效能（ AUC=0.929 ）接近。 Amyar 等 ^[16] 在其研究中放弃了手工影像组学特征，而是基于 3D-CNN 架构直接建立了一个端到端预测 EC 患者 CCRT 疗效的 DLR 模型，与同类文献中其它方式建立的模型进行对比后发现，包含肿瘤以及瘤周 2cm 信息的 DLR 模型的诊断效能最佳，符合率达到了 0.75 。 Xie 等 ^[17] 进行了一项多中心研究，旨在预测 ESCC 患者的 RT 疗效。他们从 CT 图像中提取了 EC 病灶的手工影像组学特征和 DL 特征，然后分别构建 HCR 模型和端到端的 DLR 模型并比较了它们的预测效能，结果显示 DLR 模型优于 HCR 模型（在内部和外部测试队列中的 AUC 分别为 0.802 和 0.732 ）。该研究结果表明， DLR 模型可以在不降低数据维度和删除冗余特征的情况下提高预测效能。 Li 等 ^[18] 则在 9 个医疗机构的 306 例患者中开展了 DLR 的前瞻性研究，旨在预测晚期胸段 ESCC 患者对 CCRT 治疗的反应。他们首先回顾分析每个患者的 CT 图像来确定矩形边界，以每例患者肿瘤最大层面为中心，选择 12 个连续层面，将矩形边界内的图像裁剪为 3D 立方体。然后，他们将每层图像统一调整为 32 × 32 像素，并将单通道图像转换为 3 通道图像，从而将每例患者的图像固定为 3 × 12 × 32 × 32 像素的输入格式，用于输入基于改进 ResNet34 网络架构的 DLR 模型，该模型以端到端的方式输出预测结果，结果显示，模型在在外部测试集中的 AUC 为 0.833 ，阳性预测值更是高达 100% ；此外，他们还验证了 DLR 模型与临床因素相结合构建的联合模型的预测效能，其在验证集中的 AUC 为 0.861 ，显示出更佳的预测效能。

除了通过实体瘤反应评估标准预测 CCRT 或 RT 治疗效果外，多项 DLR 研究还针对影像组学能否在新辅助治疗前预测患者疗效甚至病理完全缓解（ pathologic complete response, pCR ）状态的临床问题进行了验证。 Murakami 等 ^[19] 在 PET 图像中提取手工影像组学特征，使用 DL 分类器对接受 NCRT 治疗的 EC 患者的治疗反应进行预测， 5 折交叉验证后模型的平均 AUC 为 0.95 。该研究初步验证了 DLR 在预测 ESCC 患者 NCRT 疗效方面的潜在价值。 Ypsilantis 等 ^[20] 在预测患者 NAC 疗效的研究中，从 107 例 EC 患者的 PET 图像中自动分割病灶，然后分别提取手工影像组学特征和 DL 特征用于预测患者对 NAC 的治疗反应，并对基于手工影像组学特征和 DL 特征的分类模型的效能进行了比较。结果显示， DLR 模型具备最佳的预测性能，其平均特异度和敏感度分别为 80.7% 和 81.6% 。 Hu 等 ^[21] 进行了一项多中心研究，他们对手动分割的 ROI 提取了手工影像组学特征和基于多个神经网络架构的 DL 特征，并应用 Combat Harmonization 协调方式校正不同图像采集协议导致的影像组学特征的差异性。最后，采用 SVM 分类器建立预测模型，对比多个模型的预测效能。结果显示基于 ResNet50 提取的 DL 特征对预测 ESCC 患者 NCRT 治疗后的 pCR 状态具有最佳的效能（在内部训练队列和外部测试队列中的 AUC 分别为 0.901 和 0.805 ）。上述研究不仅证实了 DL 特征有着更强的鲁棒性，还在一定程度上说明了 DLR 模型在处理分类问题上具有更高的准确性。

5 、预测无症状生存期和总生存期

无论选择何种治疗方式，肿瘤的复发与患者的总生存期密切相关。如果能够准确预测肿瘤复发并识别出不良预后的高风险人群，临床医师可对这类人群采取更加密切的监测或调整为更为有效的治疗方案。同样，这个问题也是 EC 领域研究的热门方向之一。

在一项研究中， Wang 等 ^[22] 基于 CT 图像从 EC 病灶中提取手工影像组学特征，并使用 DenseNet-169 网络架构提取病灶的 DL 特征。随后，他们进行特征降维并分别构建了 DLR 模型、 HCR 模型、以及将 DLR 标签、 HCR 标签与临床相关因素相结合构建逻辑回归模型（ logistic regression ， LR ），来预测食道癌患者经过化放疗后未来 3 年的生存率。结果显示，在验证队列中， DLR 模型的效能明显高于 HCR 模型，而将 DLR 模型联合 LR 分类模型后取得了最佳效能，在验证队列中， LR 、 DLR 和 HCR 模型的 AUC 分别为 0.942 、 0.846 和 0.665 。该研究中还通过方差膨胀系数检验了 LR 模型中各个变量之间的多重共线性，结果显示模型标签之间不存在严重的共线性（ DLR 标签、 HCR 标签和临床相关因素两两检验，方差膨胀系数分别为 1.45 、 1.41 和 1.07 ）。这表明 DL 特征和手工影像组学特征可以互相补充信息，从而提高模型的预测能力。

Yang 等 ^[23] 构建了一个基于 ResNet18 网络架构的 3D-CNN 模型，在 PET 图像上同时进行 EC 病灶识别和预测患者一年生存率两个任务。该模型最终输出 EC 患者一年后的生存状态，预测效能分析显示其 AUC 为 0.738 。随后的随访研究发现，模型判断一年后死亡但实际存活的患者，五年生存率要低于预测存活且实际存活的患者。这意味着 DLR 模型能够准确地识别出更具侵袭性的 EC 。

Gong 等 ^[24] 在进行 DL 特征提取之前对患者的 CT 增强图像做了预处理，他们以最大 ROI 层面为中心选择 10 层，并将每个层面调整为 64 × 64 像素，以确保每个患者的输入都是 64 × 64 × 10 像素的立方体。然后，使用 3D-Densent 网络架构提取了 DL 特征，并与手工影像组学特征采取相同的降维方式选择与患者局部无复发生存率（ LRFS ）相关的特征。研究团队最终建立了 3 个独立模型：临床因素、 HCR 、 DLR 模型，以及 4 个混合模型（ HCR+DLR 、 HCR+ 临床、 DLR+ 临床因素以及 HCR+DLR+ 临床因素）。在外部验证队列中，结合了 HCR 、 DLR 和临床因素的混合模型取得了最佳预测效能（ AUC 为 0.76 ），且通过对比发现， DL 特征具有最强的泛化能力，同时也能最大程度地提高模型的预测效能。

Amyar 等 ^[25] 在研究中更深层次地应用了 DL 模型，开发了一个可进行多项任务处理的 DLR 模型，在 PET 图像上实现了对 EC 的识别、病灶勾画以及患者生存预测分析。研究者调整模型任务模式并进行了多次测试，结果显示模型可以从 PET 图像中准确识别和分割 EC 病灶；在分类任务中，符合率最高可达 0.98 ；分割任务的戴斯相似系数（ Dice similarity coefficient