数据
我们回顾性研究了2003年1月3日至2017年5月31日在斯坦福大学医学中心进行的头部或头颈部共9455例连续CTA检查报告。检查包括实质性出血、蛛网膜下腔出血、创伤后或传染性假性动脉瘤、动静脉畸形、缺血性中风、非特异性或慢性血管发现,如颅内动脉粥样硬化或其他血管病变,以及手术夹、线圈、导管或其他外科硬件。由具有12年经验的神经放射学家排除了因创伤或运动退化导致的损伤的例子。检查报告还包括非破裂性重要动脉瘤(> 3 mm)。
放射科医生标注
测试集中所有检查的参考标准由一位经过认证的具有12年经验的神经放射学家确定。
通过审查原始放射学报告确定动脉瘤的存在,对CTA检查进行双重审查。另外,如果可行,通过诊断性脑血管造影进一步确认动脉瘤。神经放射学家可以访问所有的医学数字成像和DICOM系列,原始报告和临床病史,以及注释过程中的前期和后续检查,以确定标签的最佳参考标准。
在每个动脉瘤检查中,放射科医师还确定了每个动脉瘤的位置。使用开源注释软件ITK-SNAP,在每个切片上手动分割所识别的动脉瘤。
模型建立
在这项研究中,我们开发了一种名为HeadXNet的三维CNN,用于从CT扫描中分割颅内动脉瘤。CNN是一种用于处理图像数据的神经网络,而三维CNN特别适合处理图像序列或体积。
HeadXNet是具有编码器 - 解码器结构的CNN(补充中的e图1),其中编码器将卷映射到抽象的低分辨率编码,然后解码器将该编码扩展为全分辨率分割体积。分割结果为每个体素动脉瘤的概率值,其尺寸与原图像相同。
编码器改编自50层SE-ResNeXt网络,解码器是一系列3×3转置卷积。
与UNet类似,跳过连接在3层编码器中使用,以将编码过程中的输出直接传输到解码器中。编码器是在Kinetics-600数据集上预先训练的,这是一系列标有人类行为的YouTube视频;在预训练编码器之后,最后3个卷积块和600-way softmax 输出层被移除,相应位置添加了一个巨大的空间金字塔池化层和解码器。
训练过程
在训练期间,我们从体积中随机取样16个样本的子体积。对数据集进行预处理以找到颅骨的轮廓,并且将每个样本重采样到208×208像素之前,每个样本在横断面中围绕颅骨进行裁剪。然后将切片裁剪成192×192像素(在训练期间使用随机裁剪,在测试期间使用中心裁剪),最终输入的尺寸大小为16×192×192;将相同的变换应用于分割标签。训练过程使用基于体素的二元交叉熵和Dice损失的加权组合。
在进入模型训练之前,输入图像被截取为[-300,700] Hounsfield单位,数据归一化为[-1,1]和零中心。 训练使用3个TitanXp GPU(NVIDIA),每个GPU 上的minibatch为2。 使用随机梯度下降优化器优化模型的参数,动量为0.9,随机初始化权重的peak learning rate为0.1,预训练权重为0.01。学习率通过linear warm-up从0到10000次迭代的peak learning rate进行调整,然后进行超过30万次的余弦退火迭代。
另外,对于预训练编码器的前10000次迭代,学习速率固定为0。关于正则化,对于所有可训练参数的loss加上0.001的L2权重衰减,并且在编码器块中使用随机 depth dropout。没有使用标准dropout。
为了控制类不平衡,我们使用了3种方法。
首先,错误分类的正例通过编码器和focal loss鼓励更大的参数更新,在这之后添加辅助loss。
其次,异常训练样本的采样频率高于正常样本,因此异常样本占训练迭代的30%。
最后,在训练迭代中,当分割标签完全由背景(正常)体素组成时,解码器的参数不更新。
为了产生整个体积的分割预测,连续16张切片的子体积的分割输出被简单地连接起来。如果切片的数量不能被16整除,则最后一个输入体积用0填充,相应的输出体积被截断回原始大小。
研究设计
我们进行了一项诊断准确性研究,比较了有和没有模型增强的临床医生的表现指标。参与该研究的8名临床医生,每一名诊断测试集中的115例,一半有该模型的帮助,另一半没有。临床医生对原始报告、临床病史和随访成像检查不知情。
使用交叉设计,临床医生随机分为两组。在每组中,检查按固定随机顺序对组的一半进行排序,另一半则为相反顺序排序。第1组首先阅读没有模型增强的检查,第2组首先阅读模型增强的检查。在14天的清洗期后,增强设置进行颠倒,使得组1阅读具有模型增强的检查,组2阅读没有模型增强的检查(图1A)。
临床医生标记是否存在至少1个临床重要的动脉瘤(直径大于3mm)。临床医生在诊断阅览室单独阅读,全部使用相同的高清监视器(3840×2160像素),在标准的开源DICOM查看器(Horos)上显示CTA检查。临床医生将他们的标签输入数据输入软件应用程序,该应用程序自动记录标记先前检查与当前检查之间的时间差。
当使用模型增强进行阅读时,临床医生以直接覆盖在CTA检查之上的感兴趣区域(ROI)分割的形式提供模型的预测。为了确保所有临床医生都使用熟悉的图像显示界面,模型预测的ROI在标准DICOM查看软件中显示。
在模型预测概率大于0.5的每个体素中,医生在轴向、矢状和冠状系列切片上可以看到一个半透明的红色覆盖层(图1C)。在加载检查时,医生可以立即访问ROI,并且可以切换ROI以显示未改变的CTA图像(图1B)。
红色覆盖是唯一的提示,即模型是否预测到特定CTA检查包含动脉瘤。鉴于这些模型结果,医生可以选择根据临床判断考虑或忽视。
当医生在没有模型增强的情况下进行诊断时,任何检查显示都没有ROI。否则诊断工具对于增强和非增强读取是相同的。