【关键词】人工智能;机器学习;医学影像;北美放射学会
2017
年北美放射学会(
RSNA
)上展示了许多新技术、新知识,其中最大的热点是人工智能(
artificial intelligence
,
AI
),它不是通常意义上的影像学成像技术,而被认为是目前影像领域最重要的潜在创新应用。行业专家和影像专家对
AI
的感受和判断并不一致,不乏有“
AI
是对影像医生职业的威胁”的观点,也有
AI
行业专家认为影像医生将有可能被替代
[
1
]
。目前主流的观点认为医学影像工作的复杂性,特别是在影像服务过程中,影像专家与临床专家的合作、影像专家对患者提供的咨询服务等,决定了影像医生并不会轻易地被替代。同时,影像专家也充分认识到,拒绝和焦虑不会发挥任何自我保护的作用,应主动积极的接纳
AI
,利用它来提升现有的服务质量。影像医师既是影像信息的生产者、管理者,又可成为影像与临床信息的整合者,借助
AI
拓展新的服务领域,有助于提高影像医生在医学服务中的核心地位。要做到这一点,作为影像专业的从业者,应尽快了解
AI
背后的技术,利用各种机会将其纳入医疗实践中,使患者真正受益。
以下是本人参会的部分体会和感想,需特别说明的是,笔者以外行的身份去评价其他专业的进展,所述内容必有一定的局限性和片面性,文中提及的知识、概念等不免有谬误之处,恳请专家批评指正。
AI
在医学影像中的探索过程
1
、
AI
技术概述
AI
是指利用计算机系统完成一些通常需要人类智力才能完成的任务,如视觉感知、语音和文字识别、决策制定等。
AI
是计算机科学的一个分支,与大数据等领域相互交叉,涉及内容广泛,如计算机视觉(
computer vision
)、自然语言处理(
natural language processing
)、语音识别(
speech recognition
)等,同时还包括机器人学、专家系统、知识图谱、推理机等。
2
、医学领域的
AI
研究历史
医学领域的
AI
研究并不是一个新的概念,将
AI
应用于科学研究的思路已提出数十年,只是近几年才实现了少数的临床应用案例。在
AI
的发展过程中,其方法学和研究方向均发生了较大的转变。早期的研究方向主要是知识工程(
knowledge engineering
),如专家系统、计算机辅助临床决策支持系统、定性建模和推理等。近年来由于计算能力的提高、计算方法的优化、数据量的增大,
AI
研究由知识驱动转变为数据驱动,技术手段则以机器学习(
machine learning
)和数据挖掘(
data mining
)为主。
在
AI
演变的同时,近年来的医学模式亦发生了变化。与传统的经验医学模式不同,目前临床决策的主流模式是基于循证医学和临床实践指南。在群体和社会方面,全世界范围内慢性疾病人群日益增长,医疗保健成本上升,医疗服务与医保支付的矛盾也日益显著。所以,当前
AI
在医学领域主要研究的问题是:指南和规范的应用、机器学习、语义学技术和生物信息学等。在医学影像这个分支,从
20
世纪
90
年代初开始,图像和信号处理及自然语言处理等引起了较多关注
[
2
]
。与此同时,迅速兴起的
CT
、
MRI
技术较二维成像(如
X
线)产生更大量的数据,且图像性质多样、更难以解读。早期
AI
主要研究基于模型的分割和分类、基于知识的病灶检出等,现今则是以数据驱动的机器学习最常用。
医学影像工作是高强度的技术性工作,医务人员在日常工作中要准确、高效地完成大量的临床检查。目前新一代
AI
系统已逐渐显示出越来越强的能力,有望从根本上改变这种状态,从而引起行业内外的广泛兴趣。
医学影像
AI
研究的现状
1
、医学影像
AI
研究内容以影像诊断为主
2017
年
RSNA
学术交流中使用机器学习进行影像诊断的研究几乎涵盖所有影像诊断亚专业,近年来已有不少类似的文献报道,如乳腺疾病
[
3
]
、肺部疾病
[
4
]
、神经系统疾病
[
5
]
、骨关节系统疾病
[
6
]
、心血管系统疾病
[
7
]
和体部疾病
[
8
]
等。这些研究通常的思路是:收集一定数量的图像,经过标注后(少量研究中不标注),使用机器学习得到优化的算法模型参数(多数为卷积神经网络),经过验证和测试,最终以较高的预测效能识别某种疾病,得到影像诊断。除影像诊断外,也有少数
AI
研究涉及影像技术
[
9
]
、结构式报告
[
10
]
等方面,影像与其他相关学科的关联应用也偶有提及
[
11
]
。
2
、
AI
效能的临床验证尚不充分
当前医学影像
AI
测试过程中的方法缺陷多很明显,应通过更科学的试验对其宣称的效能进行评价
[
12
]
。在
RSNA
上报告的研究通常为小样本初步探索,多缺乏真实临床场景中的验证。虽然
AI
影像诊断的研究中基本都有验证过程,但应注意,
AI
研究中定义的“验证(
validation
)”阶段与传统的医学影像研究中的验证试验是不同的,
AI
的验证通常是指模型优化过程中参数的微调过程。
AI
研究中定义的“测试(
test)
”阶段是验证模型效能的过程,常用
ROC
曲线和校准曲线作为评价指标。理论上来说,以少量训练数据集内部的样本进行测试是可行的,但在医疗工作中,很难保证提交做预测分析的实际病例与训练所用的数据集来源于同一总体,所以临床医生多主张用训练集外部的新数据进行测试,且确认
AI
模型的性能时,还要结合疾病表现谱和疾病流行情况进行综合考虑。如果有可能,
AI
效能验证试验设计的主要终点应为可评测的临床结局,研究
AI
是否可以改善临床结局是最有意义的,但当前极少研究能提供这方面的证据。
3
、
AI
应用于临床的伦理和法规问题尚待解决
当前医学影像
AI
的能力是很弱的,其输出的结果仅对医生的诊断提供帮助,最终决策仍由医生决定,所以临床应用的伦理问题尚不突出。但在其他
AI
预测能力较强的领域,关于
AI
“自我意识”的风险和伦理问题已引起关注。可以预见,如果未来医学影像
AI
能力超越专家,同时将
AI
与智能硬件结合,其输出的结果直接处理人体疾病时,
AI
以什么样的逻辑做出决策应有明确的规定,否则必将带来伦理风险,而我们现在就应有所警醒和准备
[
13
]
。现阶段关于医学影像
AI
临床验证的法规问题,是
RSNA
上厂家和业内专家的共同关注热点。
AI
与传统医疗器械明显不同,且不同
AI
产品和服务之间的差距也很大,当前监管机构还没有定义明确的
AI
临床验证方法,这对
AI
实际进入临床应用是不利的。随着
AI
引入临床路径中,支付体系将发生怎样的变化,也是各方面关注的重要问题。
4
、非传统医疗行业的资本和技术大量涌入带来正反两方面的影响
RSNA
上有不少
AI
初创公司亮相,许多互联网和信息产业的标志性企业也投入到
AI
研发中。在大会交流的论文中,有相当多的
AI
研究是由企业发起的。资本的巨大投入对
AI
的发展无疑是有益的——可吸引人才、凝聚资源、促进
AI
成果快速转化。但也要注意到,医学的进步有其自身规律,短期内大量资本的投入未必能带来医学进步的质变。在资本的裹挟下,对有些研究结果的过度解读和不当宣传,反而不利于学术本身的发展。
5
、
AI
发展中的问题远多于答案
AI
研究进展迅速,显示其潜在的临床应用价值,
RSNA
期间所有
AI
会场的交流均引起参与者极大的兴趣。但实际上,
AI
发展中给我们带来的问题远远多于答案
[
14
]
。除了技术问题,我们更关心:
AI
能否解决医疗实践中的“痛点”,减轻医生负担,提升服务患者的效果?
AI
仅仅是预测,还是真正能够改善患者的临床结局?
AI
会加强还是减弱医生与患者的沟通?
AI
会剥夺一些医生的工作和
/
或降低医生的价值(降低医生的收入)吗?医生过度依赖
AI
是否会降低技术水平?医生群体对
AI
接受度的不同,是否会造成医生相对地位的改变?
医学影像
AI
临床研究的方向
AI
研究方向的维度很多,在临床实用的方向上,建立适合
AI
研究的标准数据库、将
AI
植入实际工作中做出决策以及优化工作流程等,都大有可为。
1
、建立适合
AI
研究的标准数据库和场景
缺乏大量的、标准的、有临床结局的影像数据,是
AI
研究的难点之一。虽然中国绝大多数医院并不缺少数字化图像,但大量的病例资料并不一定能转换为可供
AI
训练和验证的数据。大数据在气象、金融、实验物理、电信、军事侦察和商业信息等多个领域的应用,得益于其标准化的数据定义和数据结构。医疗服务中,电子健康记录、基因测序、数字成像、可穿戴设备等提供了多维的、海量的、但通常非结构化、非标准化的患者健康数据,对这些数据进行分析和利用的难度显而易见。为了将医学影像数据顺利地纳入
AI
研究,需要提取影像的“组学”数据并与临床数据相结合;需要深入地研究影像资料的数据结构和索引结构,并将其用于分布式和
/
或并行计算;需要将不同维度的数据纳入统一的新模型;需要对海量的、不均匀数据集设计检索语言等。除了横断面的数据分析,还应具备多时间维度的联机分析处理、时间数据仓库设计、时间数据挖掘和可视化、综合挖掘和分析环境等方面的开发。自上而下地组织这些跨学科研究是非常困难的,较实际的解决方案是先从某个小的、简单的、数据结构清晰的领域建立数据库并发起研究
[