【
摘要
】影像组学方法是医学影像学、计算机视觉和机器学习等多学科交叉的产物,能在宏观影像水平间接反映肿瘤微观水平基因或蛋白质的变化,并且不完全依赖于影像医师的专业技能、临床经验及主观因素,所提供的是医学影像相对客观的定量信息,具有传统影像方法难以做到的独特优势。对于软组织肿瘤而言,肉眼从影像上获取的信息十分有限,明确诊断非常困难,而影像组学方法可以辅助影像医生对其进行诊断,进而帮助影像医生和临床医生更全面、更深入、更透彻地认识和理解软组织肿瘤。本文介绍了影像组学方法在软组织肿瘤中应用研究的流程,并对目前影像组学方法在软组织肿瘤良恶性鉴别、术前预测软组织肉瘤分级、评价软组织肉瘤治疗及预后方面应用研究的进展进行综述。
【
关键词
】软组织肿瘤;影像组学;人工智能
软组织肿瘤(
soft tissue tumors
,
STTs
)是一组起源于中胚层间充质组织(如黏液、纤维、脂肪、平滑肌、滑膜、横纹肌、血管和淋巴管等)中多能干细胞的肿瘤,成分复杂且种类繁多,临床、影像及病理表现各异
[1]
。软组织肿瘤的治疗以手术切除为主,对于软组织肉瘤必要时还需辅以放化疗及靶向治疗,准确的影像学诊断是临床制定治疗方案的重要依据,手术前运用影像学检查对肿瘤进行全面评估具有重要意义
[2]
。
MRI
检查具有较高的软组织分辨力,其凭借多序列、多参数成像的特点可以更清晰地显示肿瘤的大小、形态、内部信号、边界以及肿瘤对周围组织侵犯情况,已经成为软组织肿瘤病变检出、确定起源、良恶性鉴别诊断、侵袭范围评价和判断有无复发等方面最重要的临床检查方法和术前诊断依据
[3]
。
人工智能是一项用于研究并模拟人类思维与能力的新技术
[4]
。医学影像与人工智能的结合始于上世纪
60
年代,自上世纪
80
年代以来,随着基于人工智能的计算机辅助诊断软件的使用,人工智能开始逐渐整合到影像科的日常工作流程中,如肺结节和肺癌筛查、乳腺结节和乳腺癌筛查等
[5]
。影像组学(
Radiomics
)方法即是人工智能技术在医学影像学领域应用的成果,
Radiomics
的前缀
Radio
意为影像,而后缀
Omics
则源于分子生物学,用于描述生物大分子的详细特征,如基因组学和蛋白质组学等;
2012
年,该后缀
Omics
被
Lambin
等
[6]
首次用于医学影像学研究领域,
Radiomics
一词便应运而生,后由
Kumar
等
[7]
于同年进行了补充和完善,定义为“高通量地从医学影像中提取并分析高级、定量的影像特征来深层次反映肿瘤组织的空间异质性特征”。
影像组学方法是医学影像学、计算机视觉和机器学习等多学科交叉的产物,能在宏观影像水平间接反映肿瘤微观水平基因或蛋白质的变化,并且不完全依赖于影像医师的专业技能、临床经验及主观因素,所提供的是医学影像相对客观的定量信息,具有传统影像方法难以做到的独特优势
[8]
。对于软组织肿瘤而言,肉眼从影像上获取的信息十分有限,明确诊断非常困难,这时就需要使用影像组学方法来辅助影像医生对其进行诊断,进而帮助影像医生和临床医生更全面、更深入、更透彻地认识和理解软组织肿瘤。本文就目前影像组学方法在软组织肿瘤中应用研究的进展进行综述。
影像组学方法在软组织肿瘤中应用研究的流程
影像组学方法在软组织肿瘤中应用的流程分为
5
个步骤:确定研究目标、软组织肿瘤影像的获取、软组织肿瘤病灶的分割、软组织肿瘤影像特征值的提取与降维、软组织肿瘤影像组学模型的建立
[9]
。
1
确定软组织肿瘤研究目标
准确地寻找并确定研究目标是软组织肿瘤影像组学研究的关键,在确定研究目标后才能借助影像组学方法从软组织肿瘤影像中提取多维度特征以探索其与软组织肉瘤分级、软组织肿瘤良恶性、软组织肉瘤治疗及预后的相关性
[10-12]
,因此软组织肿瘤影像组学研究需要紧密的医工交叉与结合来设计合理的研究方案。
2
软组织肿瘤影像的获取
在软组织肿瘤影像组学研究的过程中,影像特征的可重复性、稳定性是十分重要的,扫描设备、扫描参数以及重建方式等都会对软组织肿瘤影像特征的稳定性造成影响,因此在获取软组织肿瘤影像前需要建立影像检查与处理的标准流程,保证扫描设备、扫描参数的一致性,减少外界因素对结果带来的误差,使影像组学特征更加稳定,从而获得精准的特征值分析与建模结果
[13]
。目前,大部分软组织肿瘤影像组学研究使用的均为同一检查机器及固定的检查参数
[9-10,14-18]
,但也有部分研究使用了不同机器及不同检查参数
[12,19-21]
。
3
软组织肿瘤病灶的分割
准确地对软组织肿瘤病灶进行识别与分割在软组织肿瘤影像组学研究中至关重要。在采集了大量标准化的软组织肿瘤影像数据后,需使用手动、半自动或全自动图像分割方法对软组织肿瘤病灶进行分割,其中手动分割具有主观性,准确性较高,但可重复性较差,建模结果会受到不同医生对影像解读方式的影响
[22]
。在半自动和全自动分割领域,
ITK-SNAP
、
3D Slicer
和
Image J
等软件的应用较为广泛,
ITK-SNAP
由宾夕法尼亚大学开发,其提供了基于主动轮廓的半自动分割方法
[23]
,在软组织肿瘤影像的半自动分割中已经得到应用
[14,24]
;
3D Slicer
由美国国家卫生研究院开发,提供了多种分割方法,如基于区域生长、基于模板、基于交互和基于统计等,在软组织肿瘤影像的半自动分割中也已得到了应用
[17]
。另有研究表明,基于
3D Slicer
的半自动分割方法与手动分割方法相比具有更佳的可重复性
[25-26]
;
Image J
是一款基于
JAVA
的图像处理软件,已被应用于影像组学鉴别脂肪瘤与脂肪肉瘤的研究之中
[20]
。半自动及自动分割方法的优点是高效且重复性高,但使用其分割的兴趣区相对于手动分割的兴趣区精确度会有偏差,对于边界不清晰的软组织肿瘤可采用手动分割方法;而对于边界清晰且形态规则的软组织肿瘤,半自动或全自动分割方法高效且重复性高,能够满足海量数据分割的要求
[27]
。病灶影像的精准分割是软组织肿瘤影像组学分析的前提,但影像的伪影及软组织肿瘤对周围正常组织的浸润会导致病灶边缘显示不清,致使病灶影像的分割存在一定难度。目前,分割精确度高且重复性好的病灶影像分割算法还有待开发与研究。
4
软组织肿瘤影像特征值的提取与降维
软组织肿瘤影像特征值的提取是使用计算机算法在像素水平上将软组织软组织肿瘤影像数据转化为大量量化的影像特征值数据再进行分析,是软组织肿瘤影像组学研究的核心步骤
[9]
。不同软件或平台计算特征值的方法各不相同,特征值可以分为如下几类,即一阶统计形态学特征、二阶统计特征、高阶统计特征、基于模型和基于变换的特征。
一阶统计形态学特征主要包括病灶的大小、形状等,也称为语义特征,主要量化像素值的分布规律而不考虑其空间分布关系,其指标包括平均灰度值、标准差、熵值等
[28]
。二阶特征即纹理特征,主要量化兴趣区内相同灰度或像素强度间的空间关系,指标有灰度级共生矩阵、灰度级长度矩阵、灰度区域大小矩阵等,间接反映病变的异质性,相当于二维直方图,多用于模式识别中
[28]
。
高阶特征是利用邻域灰度差矩阵计算高阶统计量,研究三个或更多体素间的空间关系,包括邻域灰度差值矩阵和灰度区域大小矩阵灰度级形状矩阵等。基于模型和基于变换的特征是将提取的图像特征进行滤过,常用的滤过包括基于拉普拉斯算法的高斯滤过、
Gabor
滤过、小波变换及分形维数变换等
[29]
。
勾画的软组织肿瘤兴趣区经过特征值提取后可获得成千上万的特征,这与原始数据的样本量相差悬殊,会导致模型的过拟合,因此模型的建立有赖于病变主要特征值的降维分析。目前,常用的降维算法包括方差选择法、单变量选择法及最小绝对收缩和选择算子等
[22]
。
5
软组织肿瘤影像组学模型的建立
软组织肿瘤影像组学模型的建立需要通过大数据的机器学习来完成,机器学习是使用程序代码让计算机模拟或实现人类的学习行为,达到获取新知识或技能的目的。需要指出的是,机器学习的概念在上世纪
60
年代就已经被计算机科学家提出
[30]
,但机器学习技术于近十年才开始被应用于医学影像领域。机器学习的方法包括:无监督机器学习、半监督机器学习及监督机器学习
[29]
。
无监督机器学习是对数据采用热点图分析或聚类分析,挖掘数据的自然结构特征,不预设数据标签。
监督机器学习则需要设置数据标签来训练模型,常用的监督机器学习算法包括支持向量机(
support vector machine
,
SVM
)、随机森林(
random forests
,
RF
)、决策树(
decision tree
,
DT
)和逻辑回归(
logistic regression
,
LR
)等,其中
SVM
由
Cortes
等
[31]
于
1995
年提出,一般应用于二分类问题当中,具有相对优良的性能指标,是建立在统计学理论基础上的机器学习方法,能够寻找出区分度较高的支持向量,可以最大化类与类的间隔,因此具有较好的适应能力和鉴别能力,在软组织肿瘤影像组学研究中得到了广泛的应用
[9,11-12,14,19]
。
SVM
只需由各类域边界样本的类别来决定最后的分类结果,其优点是不依赖全部样本数据就可以解决高维度问题,缺点是核函数的确定有一定难度,且核函数的选择会影响分类结果
[30]
。
RF
是由
Breiman
[32]
于
2001
年提出的一种利用多个树分类器进行分类和预测的方法,其输出类别由单个树输出类别的众数而定,通过随机方法建立一个由很多棵无关联决策树组成的森林,在输入新样本时森林中的每一棵决策树会对其分别进行判断,最终根据相对多数投票法即该样本被选择最多的分类给出其分组,
RF
在软组织肿瘤影像组学研究中也有应用
[9,11-12]
,该算法以能够降低过拟合现象为优点,但其不能较好地预测超越训练集外的数据
[30]
。
DT
因其输出结果类似一颗倒置的树而得名“决策树”,本质上可看作一个树状预测模型,通过将实例从根节点排列到某个叶子节点完成分类。
DT
在软组织肿瘤影像组学研究中也有应用
[19]
,其优点是计算省时,缺点是易出现过拟合现象
[30]
。
LR
的基本原理是将标记好的数据通过机器学习总结归纳得出分类模型或分类决策函数,通过输入离散或连续变量对输出结果进行分类,其缺点是当特征维度很大时该模型的准确性不佳
[33]
。
LR
在软组织肿瘤影像组学研究中亦有应用
[12,14,20]
。
半监督机器学习则介于无监督机器学习和监督机器学习之间,通过使用大量未标记的数据和少量标记的数据来对模型进行训练,主要用于类别标签不明确的数据
[34]
。
不论使用何种机器学习方法,均需对比训练集及验证集的受试者操作特征曲线(
receiver operating characteristic
,
ROC
)的曲线下面积(
area under curve
,
AUC
)、敏感度、特异度、符合率、召回率及和
F1-Score
等指标来评价机器学习模型的诊断效能及稳定性。
影像组学方法在软组织肿瘤中应用研究的进展
作为一种新兴的医工结合手段,影像组学方法用于软组织肿瘤的研究与传统软组织肿瘤影像研究的不同之处主要体现在传统影像手段仅能通过兴趣区测值的方法来间接反映软组织肿瘤的局部信息,无法反映软组织肿瘤的整体情况,而影像组学方法则能提取软组织肿瘤病灶多个层面乃至全部层面的影像特征,从而对软组织肿瘤的异质性进行全面评估。
目前,影像组学方法在软组织肿瘤良恶性鉴别、术前预测软组织肉瘤分级、评价软组织肉瘤治疗及预后等方面都有应用研究。
1
影像组学方法在软组织肿瘤良、恶性鉴别中应用研究的进展
软组织肿瘤的良、恶性鉴别一直是临床关注的重要问题,相比于良性软组织肿瘤,恶性软组织肿瘤内部的异质性更明显,因而可以借助影像组学方法来鉴别软组织肿瘤的良恶性。
Mayerhoefer
等
[10]
通过对经过病理证实的
58
例软组织肿瘤患者(良性
30
例,恶性
28
例)的
T
1
WI
、
T
2
WI
及
FS-T
2
WI
图像进行纹理分析,分别比较了
K
最近邻算法和人工神经网络算法的诊断效能,其中基于
FS-T
2
WI
序列的人工神经网络算法取得了
90.5%
的符合率,故作者指出良恶性软组织肿瘤在常规
MRI
图像信号特征上只有很小的差异,机器学习算法可能有助于鉴别软组织肿瘤的良恶性,但是需要更多数据来证明其临床价值。
Wang
等
[14]
通过使用
91
例软组织肿瘤患者(良性
55
例,恶性
36
例)的
FS-T
2
WI
图像进行影像组学诺模图和决策曲线分析,得出影像诺模图能够将恶性与良性软组织肿瘤区分开(
AUC
为
0.94
),且诺模图的诊断效能优于单一的影像组学模型和临床模型,由此指出结合了影像组学特征和临床特征的诺模图是一种无创且低成本的术前预测软组织肿瘤良恶性的方法。
Juntu
等
[19]
通过对
135
例软组织肿瘤患者(良性
86
例,恶性
49
例)患者的
T
1
WI
图像进行纹理分析,并将三种机器学习模型(支持向量机、人工神经网络、
C4.5
)的诊断效能与影像科医师进行比较,得出支持向量机分类器的符合率为
93%
,优于影像科医师(
90%
),经过纹理分析训练的机器学习分类器对于在
T
1
WI
图像中检测恶性肿瘤具有潜在的价值,对分类器的学习曲线分析表明小于
100
个
T
1
WI
图像的训练数据量足以训练出诊断效能和影像科专家一样的机器学习分类器。
Kim
等
[15]
通过对
40
例含有粘液成分的软组织肿瘤患者(良性
23
例,恶性
17
例)的
ADC
图进行纹理分析,发现恶性组的峰度、能量、相关性和均质性均明显高于良性组,但对比度和方差均低于良性组,因此认为基于
ADC
图的纹理分析有助于鉴别良恶性含黏液成分的软组织肿瘤。
Chen
等
[35]
通过对
114
例软组织肿瘤患者(良性
73
例,恶性
41
例)的超声图像进行纹理分析,通过使用
10
个形态学特征和
6
个灰度共生矩阵特征来鉴别良恶性软组织肿瘤,并将纹理分析的诊断效能与四位诊断医师进行比较,发现纹理分析的诊断符合率(
89.5%
)高于诊断医师(
74%
~
86%
),这表明在超声检查中使用纹理分析进行辅助诊断可成功地区分良性和恶性软组织肿瘤,以避免不必要的穿刺活检。
Xu
等
[16]
通过对
103
例软组织肿瘤患者(良性
44
例,恶性
59
例)的
PET/CT
图像进行纹理分析,分别对
CT
图像上计算的纹理参数、
PET
图像上计算的纹理参数以及
PET
和
CT
组合的纹理参数进行计算,将它们的诊断效能与标准化摄取值方法进行比较,发现仅使用
PET
(或
CT
)纹理参数的符合率为
74.76%
(
72.82%
),与
SUV
方法没有显著差异,但将
PET
和
CT
最佳纹理参数(
PET
:熵和粗糙度,
CT
:熵和相关性)进行联合纹理分析的方法表现出更好的诊断效能(符合率为
82.52%
),因此得出使用纹理分析的方法能够显著提升
18
F-FDG PET/CT
对软组织肿瘤良恶性的鉴别诊断能力。
Thornhill
等
[20]
通过回顾分析
24
例脂肪瘤和
20
例脂肪肉瘤患者的
T
1
WI
、
T
2
WI
、
FS-T
2
WI
及
T
1
WI
增强图像,在
T
1
WI
上对病灶进行勾画并提取灰度级共生矩阵特征、灰度级长度矩阵特征及形态学特征,将纹理特征的组合用于训练多个线性判别分类器,最终使用
10
折交叉验证评估每种分类器鉴别脂肪瘤和脂肪肉瘤的诊断效能,并和两位影像科医师的诊断效能进行比较,发现影像组学模型的诊断效能(
91%
)高于两位影像科医师(
80%
、
77%
),因此指出计算机辅助诊断模型有助于影像科医师鉴别脂肪瘤与脂肪肉瘤。
2
影像组学方法在预测软组织肉瘤组织病理学分级中应用研究的进展
软组织肉瘤(
soft tissue sarcomas
,
STSs
)的组织病理学分级关系到患者的预后及临床治疗方案的制定
[36]
,如果能在术前通过影像组学方法建立精度逼近病理的软组织肉瘤组织病理学分级预测模型,那么对其临床治疗方案的制定有重要的指导意义。影像组学特征能间接反映软组织肉瘤内部的异质性,而软组织肉瘤的异质性越高则其组织病理学分级越高。因此,影像组学特征与软组织肉瘤的组织病理学分级相关。