目的
比较和分析人工智能(AI)技术、低年资放射医师、高年资放射医师、AI联合低年资放射医师对新冠肺炎CT的诊断效能,探讨AI对新冠肺炎CT的辅助诊断价值。
方法
回顾性分析经AI新冠诊断软件诊断新冠概率>0%的53例患者图像,
统计计算A组(低年资医师,参与放射诊断工作<10年)、B组(高年资医师,参与放射诊断工作≥10年)、C组(AI)、D组(低年资医师联合AI)的初次CT诊断新冠肺炎信心评分的受试者特征曲线(ROC),Z检验比较各组诊断效能;并以AI诊断新冠肺炎最大约登指数相应的截断值为标准,比较各组的敏感性、特异性。
结果
1. 各组诊断效能曲线下面积比较(AUC):A组<B、D组(z=2.406、2.013),C组<D组(z=2.031),B组>C组(z=2.113),差异均具有统计学意义(
p
<0.05);余组间差异均无统计学意义(
p
>0.05)。2.
以AI诊断新冠肺炎最大约登指数相应的截断值>
3分
为标准,
各组对新冠肺炎CT的诊断效能比较。敏感性:A组<B、D组(x
²
=3.854、13.781),C组<D组(x
²
=7.726),差异均具有统计学意义(
p
<0.05);余组间差异均无统计学意义(
p
>0.05)。特异性:A组<B、D组(x
²
=6.876、6.876),差异均具有统计学意义(
p
<0.05);余组间差异均无统计学意义(
p
>0.05)。
结论
基于深度学习的AI技术在新冠肺炎CT诊断中具有较高的临床应用价值,AI可辅助低年资医师提高对新冠肺炎的CT诊断效能。
图1 各组
ROC曲线下面积(AUC)比较
图2 男 52岁,发热、咳嗽就诊,无明确新冠肺炎患者接触史。a):两肺胸膜下为主的毛玻璃密度影,A组新冠肺炎诊断信心评分2分,B组5分。 b):C组评5分,病灶体积占肺7.46%。RT-PCR检测阳性,新冠肺炎。 D组评3.5分。 c):一周后病灶部分实变。
d):AI示病灶体积占肺体积5.71%,提示部分吸收。
图3 男 82岁,发热、咳嗽、胸闷,明确的疫区人员接触史,有慢性间质性肺炎既往史,白细胞值正常、淋巴细胞值处于下限、血清淀粉样蛋白酶↑。a):两肺胸膜下为主的磨玻璃密度影伴间质增厚。b):C组根据影像特征示新冠诊断评分3分,病灶体积占肺24.95%。A组评3分,B组结合实验室指标及临床病史对其评5分。最终RT-PCR阳性,新冠肺炎。
AI对新冠肺炎CT辅助诊断的应用特点
本次研究AI(C组)诊断新冠肺炎的AUC达到了中等度的0.753,敏感性、特异性分别达80.56%、64.71%,显示其有一定的诊断应用价值,这三项指标虽高于低年资医师(A组),但结果不具统计学意义,显示C、A组诊断效能相差不大。而蔡雅倩
等学者研究发现住院医师联合AI后降低了对肺毛玻璃结节筛查及定性诊断中的误诊率、漏诊率,敏感性也从65.20%上升到96.02%。本组联合低年资医师与AI的D组对新冠肺炎诊断的敏感性、特异性达到了94.44%、70.59%,明显高于A组的75%、52.94%(
p
<0.05),接近蔡雅倩
等的研究数据,且本次D组的AUC为0.853,也明显高于A组的0.717(
p
<0.05)。充分说明联合AI后对低年资医师诊断新冠肺炎具有显著的提升作用。我们分析主要原因包括(1):AI已“深度学习”了数千例新冠肺炎病例,积累的“数据”量远远超过了低年资医师。(2):刘小玉等学者发现首次CT新冠肺炎筛查的敏感性可以高于核酸检测
,本组53例筛选出的具有新冠肺炎概率的病例是在数千名常规胸部CT检查中筛选出来的,AI没有低年资医师的视觉、脑力疲劳等问题
,所以AI在新冠疫情大量病人需要筛查时具有优势。(3):低年资医师对新冠肺炎的诊断及鉴别诊断经验积累不足。所以低年资医师联合AI诊断可以弥补自身所没有的大量“数据”经验。
本次研究中由于部分病例的肺内病灶分布于非胸膜下为主,与典型的新冠肺炎征象不甚相同,且部分病患具有一些肺外新冠征象如纵膈气肿、肝实质密度减低等,这与丁义等学者研究结果相似,而AI不能发现肺外的征象;侯可可