专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

医疗影像AI的“九九八十一难”？ | 独家深度

DeepTech深科技 · 公众号 · 科技媒体 · 2017-12-26 16:00

正文

今年11月，吴恩达领导的一支斯坦福团队发布了一项将深度学习应用到医疗领域的成果。

当时，他们设计出了可以用来检测肺炎的“ CheXnet ” 算法，这种算法是一个 121 层的卷积神经网络，能够通过胸部 X 光片判断病人是否患有肺炎。据该团队的描述，CheXnet 的水平已经超越了专业的放射科医师。

这个引人注目的成果在近日引起了一位放射科学者的质疑，那就是来自澳大利亚知名学府阿德莱德大学的 Luke Oakden-Rayner。这名在读医学博士生,曾发表过多篇医疗人工智能方面的文章，包括曾以第一作者的身份于今年 5 月在 Nature 上发表利用深度学习等技术预测人类寿命的文章。

Luke Oakden-Rayner 对 CheXnet 的质疑主要来源于该算法所使用的 ChestX-ray14 数据集（ChestX-ray14 是目前最大的开放式胸透照片数据集，由美国国家卫生研究院发布， CheXnet 使用了ChestX-ray14 作为训练的数据集）。他发现，与人类医生的视觉评估相比，该数据集中的标签不准确、不清楚，并且经常描述医学上的次要发现。“我认为，这些标签无法匹配图像中显示的疾病”，他在博文中写道。

※ 博文地址

https://lukeoakdenrayner.wordpress.com/2017/12/18/the-chestxray14-dataset-problems/

同时他也认为，找到精确的数据集或正确的标签，进而让机器高效地执行医疗任务是非常困难的。

目前，吴恩达团队并未公开回应这一质疑。而这件事反映的数据问题也只是现阶段把 AI 应用在医学影像上“九九八十一难”中的一难。

跑鞋的漏洞

站在人工智能的起跑线上，谁拥有更多的数据谁就有了更好的跑鞋。与其他大部分传统行业相比，高度注重信息化的医疗行业无疑有不少“跑鞋”，而在医疗行业中，性能最好的“跑鞋”又属医学影像数据。

毕竟，对于以数据为最基础食材的人工智能来说，没有什么比医学影像数据更好咀嚼：在医疗大数据中，超过 80% 的数据来自于医学影像，人工智能可以借助这些海量数据去生成算法模型，这保证了模型最大的包容性。

医学影像数据尤其适配基于深度学习的图像识别技术。现在，深度学习是应用最广也最为成熟的人工智能技术之一，其进步最快的领域之一就包括图像识别。利用数据量以及计算量作为模型驱动力，卷积神经网络（CNN）以及深度神经网络（DNN）等深度学习算法已经超越传统方法的图像识别性能，我们甚至频频听到 AI 不断逼近甚至刷新人类医生的水平的消息。

来自中国国家癌症中心的高亦博教授则认为，目前所谓的人工智能解决的都是非常明确具体、基本属于一步式的判断任务，它还不具备类似人脑的高度适应各种具体问题的能力，而影像诊断中每一个分辨步骤都已经非常清楚，因为大夫在读片时也是分步骤有规矩的。

“在医学影像上使用 AI 有两个天然优势，一是我们可以把诊断的思考过程明确地分解为若干步骤，二是医学影像的识别结果可以很容易地实现两分法，即有肿瘤还是没有肿瘤，或者这个肿瘤是良性还是恶性，这样的任务容易用当前流行的深度学习、神经网络进行处理”，高亦博教授对 DT 君解释道。

很明显，在 AI 与医疗场景的结合中，基于深度学习技术的医疗影像的识别与分析，是目前最有希望在整个医疗领域中率先进入大规模应用阶段的。这一点同样得到了医疗界的认可，北京大学人民医院放射科原主任杜湘珂教授就在北京大学医学部影像医学学系第二次学术年会上表示，她感受到 AI 跟影像专业居然有这么密切的相关性。

“在所有的数据里，影像的数据跟临床病理比较起来，它的标准化、格式化、统一性是最强的。说实在的，目前的病理数据仍然过于凌乱，无法与数字影像数据相比”，她说，“人工智能几乎无处不在，你问问所有的放射科大夫，放射科主任都会跟你说，我们也在跟 AI 合作，某某公司在找我们”。

但尽管有了好“跑鞋”，相比多数用 AI 做图像识别的应用或行业，AI 在医疗落地的难度绝对是最困难的情况。依图的医疗副总裁郑永升告诉 DT 君，医学本身的发展上，不论是所谓科室常规性的应用，还是像肿瘤、基因这样一些比较前沿的课题，医学自身的发展和标准化，以及整个临床规范的普及，其实非常需要深入地进行解决，其中存在的问题也是被人们大大低估的。

姑且先撇除算法必须通过严格的临床实验及法规，光是在数据及训练上至少就有两件事得解决。

首先，真实世界中的数据是海量的，并充满缺失和不足，实际工作中，很多数据工作都是和真实世界的缺陷做斗争，这一点在医学影像中也一样。数据质量的提升就需要非常非常长的时间周期，和人们讨论的医学伦理相比，这个问题会成为真正的困扰。

尽管大多数放射科已经进行了数百万次的影像检查，结构化程度也较高，但是大部分都没有标记。特别不一样的是，影像数据很难像语音数据或者文本数据一样将标注任务外包出去，影像数据的标注大部分只能仰赖专业人士。

举例来说，不论是在安防领域或是自动驾驶领域，一般人都可以为图像进行标注，因为常人都可以分辨出人、猫狗动物、汽车、信号灯等，但是，在医学影像里，一般人根本看不出身体到底哪里出了异常，例如给普通人看一张 CT，他是无法分辨什么有或没有癌症、位置在哪里，更不要说有时肿瘤还非常小，这是只有受过专业训练的医生才具备的判断能力。

负责糖尿病视网膜病变计划的 Google 研究团队产品经理、医学博士彭浩怡（Lily Peng）也在接受媒体采访时曾指出，Google 团队建立了一个数据集，特意聘请 54 名专业眼科医师评估超过 13 万张的图像。

而在现阶段的医学影像 AI 上，数据几乎是公认比算法更重要，甚至可以说，医疗数据之于医学影像 AI 的重要性，已经无异于道路测试之于自动驾驶汽车了。“数据反映的是真实的世界，算法不合适就换个算法再尝试”，高亦博教授说。而对于人工智能来说，一条已经被验证过无数次的箴言是，训练使用的数据越精确，训练出来的机器也会变得越强。

因此，想要训练出好的医疗 AI，就必须仰赖专业医生的协助，替影像数据进行精确地标注。换句话说，必须有人类名师的帮忙才能培养出 AI 高徒。

除此之外，还有影像数据获取和使用的问题。医院内部做 AI 研究，数据获取是相对容易，但对外部的人来说，想要拿到医院的影像资料并不简单。

DT 君和不少业内人士接触的过程中也发现一个有趣的现象，比起强调归属的“采集数据”，他们更多使用的说法是“接触到数据”。

其中的意味是，政府并没有明确规定这些数据究竟属于谁。这一问题也困扰着像医拍智能这样的初创公司。成立于 2015 年的医拍智能主营业务为运用计算机视觉进行医疗单据拍照识别，在今年，他们将业务拓展至医疗影像 AI 上。其首席科学家杨琼对DT君说：“我们还没有看到国家有很明确的指导意见，很多医生都期待更多的改进，但是他们又担心，这些数据能不能拿出来给公司做训练呢？国家没有说可以，也没有说不可以。”在加入医拍之前，杨琼先后任职于微软亚洲研究院、欧洲微电子中心、百度深度学习研究院。

但是，政府明确许可可以使用这些医疗数据就万事大吉了吗？不一定。看看全球人工智能标杆公司 DeepMind 现今的处境吧。

这家造出 Alphago 的 AI 公司, 其实一直在尝试将人工智能技术应用到医疗中。但他们却在英国国家卫生局的项目上惹上了麻烦。该项目为 DeepMind 提供了 160 万个病人的医疗数据，但英国信息专员办公室确认为 DeepMind 有侵犯病人隐私数据的嫌疑。现在，DeepMind 仍然陷在数据使用问题引发的官司中。

DT 君还采访过一家专攻 AI 医学影像辨识的新加坡初创公司 adaline。这家公司的情况就更为特殊了，他们与新加坡公立医院合作取得了 1000 多位病患的影像数据，但这个数量是完全不够的，adaline 希望在包括东南亚、（中国）香港、（中国）台湾等地区拿到至少 10 万个病例。

而现实的情况是，想要跟各地的医院合作就得按各地的法规来走，这对于初创公司来说必定会是一条漫长的路。但没有人会轻易放弃，因为谁越快接触到越多数据，就越有可能在这个日益拥挤的市场中占到位置。

“毫无疑问，机器学习将改变放射科医师在未来几年的实践方式，但在机器学习变得普及之前，还有许多工作要做，”斯坦福大学放射学及生理医疗信息系教授 Curtis Langlotz 曾这样说。

谁来领跑医学影像 AI？

也正是因为包括上述原因在内的种种因素，在国内，我们还未看到在医学影像 AI 占据绝对优势地位的领跑企业。而计算机视觉的第一梯队已经非常明显地跑出来了：5年前，施米德胡贝教授的团队采用深度学习算法赢得了乳腺癌识别检测的比赛，这是深度学习第一次赢得医学影像竞赛，同样是在那一年，正在 MIT 实验室担任博士后研究员的朱珑创办了依图科技，现在，依图科技已经位列中国 CV 第一梯队。

但是，与计算机视觉相比，医学影像 AI 如今的行业格局，其实更接近于当年互联网医疗初期的情况：

在支撑的技术初步成熟和资本加持的前提下，一大批初创的公司正在往外冒，这些公司全部集中来利用深度学习算法读医学影像的片子。与此同时，像阿里巴巴、腾讯、科大讯飞这样的大公司也卯足了劲“插一脚”——阿里健康发布医疗 AI 系统 Doctor You，该系统就包括医学影像辅助诊断云平台；腾讯在今年 8 月发起人工智能医学影像联合实验室，并公布其首个 AI 医学影像产品“腾讯觅影”，辅助早期食道癌等疾病的筛查；科大讯飞有智慧医疗事业部，这家语音人工智能公司在今年 8 月还刷新 LUNA 医学影像国际权威评测世界记录……

可当我们回顾热潮大致退去的互联网医疗，其结果不可谓不惨烈。在此前一份网上盛传的“互联网医疗死亡名单”中，不乏壹药网等知名互联网医疗企业。在 2016 年，寻医问药网、就医 160、好大夫等在线医疗平台传出裁员传闻，阿里健康事业部据称则在 2016 年绩效考评中屈居倒数。到了今年年初，百度宣布百度医生下线，此举标志着百度退出移动医疗。

从高喊“颠覆”口号到节节受挫再到现在的全面收缩并投靠实体机构，过去这几年时间里，互联网医疗可谓经历了一场名副其实的大起大落。

在这片曾经的热土上，我们还能看到的尚且站得住脚的也就春雨医生、好大夫、丁香园、平安好医生等少数几家公司。

但医学影像 AI 浪潮不见得会重蹈这样的覆辙。

虽然都需要在医疗数据中掘金，但互联网医疗的模式主要是“平台化+服务闭环”，其核心主旨可以概括为“连接一切医疗资源”，比起技术优势，互联网医疗公司的胜出规则会更强调其资源整合实力，而医学影像 AI 本身倒更接近于一个工具，生死存亡自然就更依赖于技术。另外，正如上文提到的，医学影像 AI 对数据的依赖程度比互联网医疗高得多，伴随着数据质量提升和规范的漫长过程，其发展周期会更长，悬念也就更大。

其实说起来，医学影像算是互联网医疗浪潮中略被忽视的一个方向。互联网医疗非常注重推行分级诊疗，但分级诊疗其实受制于基层硬件设施和医生能力，因此仍需要一定程度的远程医疗，而远程医疗就少不了借助影像报告作为辅助判断，但在刚刚过去的这轮互联网医疗浪潮中，医学影像并不是主攻方向。

尽管如此，医学影像 AI 仍然受益于互联网医疗的发展，尤其是在数据上。例如说，2015 年 7 月国务院发布《国务院关于积极推进“互联网+”行动的指导意见》就明确要求提高医学影像网络化、信息化、移动化水平，各种互联网医疗公司也都曾不遗余力地让连通各方数据。

互联网医疗的发展脉络中，值得那些医学影像 AI 的初创公司参考的，有一个坏消息和一个好消息。

坏消息是，互联网本身和医疗其实存在着一些难以调和的天然矛盾，例如说互联网本身体量很轻，而且十分讲究开放，并且追求迭代速度要快，但医疗却完全相反，体量重而且是个“慢性子”，同时还相对封闭。因此从现在的结果看来，互联网医疗与其他互联网+相比并没有取得更突出的成绩，或者说要付出更多的代价才能达到相同的效果，甚至某些方面还落后些。这个经验很有可能继续在医学影像 AI 中得到验证。

好消息则是，在这一场医学影像革命中，肯定既会有赢家也会有输家，和互联网医疗一样，不一定是大公司就能笑到最后。医疗领域中巨大的红利吸引着各大互联网公司纷纷“铤而走险”，但对他们来说，医疗仍是一块最“难啃的骨头”。

例如，医学影像 AI 公司的核心竞争力就包括如何基于对数据的理解应用好算法，这其实也考验他们对应用场景的理解。互联网公司在这一点上并没有太突出的优势。高亦博教授对 DT 君说：“医学影像 AI 中，数据最重要。但大部分 IT 企业，包括 BAT 这样的大公司，往往很难理解数据是怎么生产出来的，所以非常容易出问题”。

而在杨琼看来，医疗数据中有非常多的“脏活累活”是大公司所不愿意做的，但初创企业会有足够的热情和精力投身其中。“未来国内一定会有一家本土公司迅速成长起来”，她说。但她同样强调，这其中需要行业标准的充分到位。

依图的郑永升同样坦言他们并没有感受到来自这些互联网公司的压力。“各公司有不同的思路，彼此之间的关系其实更接近于相互补充而非竞争。我认为，巨头优势在于资本和品牌优势。它们很可能没有认真想做这件事情，但是一旦有动作，那么吸引更多人关注的效果好过创业公司，如果他们认真投入做了，我觉得对整个行业是有推动作用的，这其实是我们乐意看到的”，他说。

但创业公司面临的也面临着不少挑战。现在，人工智能医学影像产品主要应用于疾病筛查阶段，这个环节能否获得稳定的商业模式仍然存疑，如果长期依靠融资和微薄的收入支撑业务发展，创业公司也不见得能比财力更为雄厚的互联网公司跑得更远。

来自放射科医生的声音是，以临床需求为导向的公司会是最后的胜出者。杜湘珂教授和 DT 君透露，目前医学影像 AI 仍处于一个非常早期的发展状态，产品质量参次不齐, 最后能走下去的必然是那些在技术研发上投入大量精力，紧密结合临床需求，产品过硬的企业。

现在，国内 60% 的医疗影像领域的创业公司处于发展早期（A 轮及之前阶段），但同样已经有几家医学影像 AI 公司完成了 B 轮融资，他们比其他同行跑得更快的一批，但下一轮的融资考验的就不再是用“刷榜”来作为业务的衡量指标。医学影像 AI 公司迅速迈过科研阶段走向商业化落地，医院和投资机构都在等待他们拿出更成熟的产品和更有说服力的使用数据，2018年的市场考验将比之前来得更为猛烈。

“与其谈算法，不如谈标准”？

当数据作为推力把医学影像推向人工智能的同时，也在一定程度上限制曝露出医疗 AI 正在面临的艰难问题：中国每年的基础数据量超过欧美，特别是根据众多人口数量获得的医疗和健康数据，这些数据很可能藏着医疗 AI 的下一个风口，但是它们往往缺乏统一的标准（比如说电子病历，其历史数据比较多，但数据规范程度比较差），在人工智能所强调的数据的 4V 属性（volume 数量、variety 多样性、velocity 速度、veracity 真实性）上缺斤少两，因此其利用率和利用价值并不高。这些处于留守状态的医疗数据还需要经过的更为漫长的演进过程才能为人工智能所利用。

当然，医疗数据标准化问题早已引起了业内人士的注意。用依图医疗总裁倪浩的话来说就是：“仅谈算法是外行的表现，内行的人都谈标准”。这家中国的 CV 新星在成立早期就以医学影像为主要切入点，现在，依图的阅片机器人产品已经在几十家三甲医院的影像中心落地。

在改变医疗数据现状的主力军中，医拍智能也是其中的一员，目前他们正在联合多方进行临床数据标准的制定工作。“我们在跟一些医学机构合作去建立一些医学标准，进而利用这个医学标准去处理临床数据。此前的临床数据情况是这样的，不同的医生用的诊断语言不一样，各个医院采用的标准也会有区别。导致这种现象的原因非常复杂，这样的数据也不能很好地和人工智能技术结合”，杨琼对 DT 君说。

她也承认，鉴于上述原因，临床数据的标准化会比影像进展得要慢些，但是，等这个标准建立好之后，其发展速度会非常快，因为临床数据本身非常有价值。

当然，参与这样的数据标准化制定不会“光吃力不讨好”，其所带来的好处是显而易见的：在算力和算法持续快速进步的基础上，获取相当数量的高质量数据已经成为医疗 AI 最重要的竞争力；作为医疗领域最重要的资源之一，数据的归属和使用很有可能在标准化过程中面临发生新的变化，越早越广泛地参与到规则的制定，即意味着公司能够掌握更多的主动权。

在此类讨论中，永远有一点值得所有人记住：一场医疗革命注定会造就市场上的所谓赢家和输家，但最大受益者将是所有获得更好治疗的患者以及躲过了疾病魔爪的人们。

医学影像对于大多数人来说都不陌生，几乎也和每一个人都相关。这项可以让医生无需动刀就能观测病患身体内部状况的技术，包括我们听说过的超音波、 X 光片，还有电脑断层扫描（CT）、核磁共振成像（MRI）、正子造影（PET）、单光子断层扫描（SPECT）等。每一种方式都有自身优势，适合用来检查不同的病症。

在医院中，负责解读医学影像的是“放射科医生”。他们的工作就是查看影相资料、打出报告，提供给专科医生去拟定治疗方案。

这个看似寻常的操作背后隐藏着一个巨大的行业缺口：我国医学影像数据的年增长率约为 30%，而放射科医师数量的年增长率约为 4.1%，医师数量的增长远不及影像数量的增长，且培养具有专家诊断水平的医生耗时漫长。其带来的隐患是显而易见的，比如说繁重的任务带来较高的误诊、漏诊率。

放射科医生的工作负担之重远超人们的想象。由于影像检查的对临床诊断的重要意义，大部分患者来医院就诊均会接受影像检查，检查后会产生大量的图像数据，根据检查方法的不同，有些患者的检查图像可多达近千幅。这些数据经网络传输到医师工作站后，放射科医生需要在显示器上一张一张地观察图像，手动圈出肿瘤的位置，简单病例的几分钟能搞定，复杂的要花半个小时以上。大医院的放射科医师每天都要阅读上百位患者图像。

因此，医学影像 AI 对医疗界的吸引力之一就在于它能帮助医生提高诊断效率。事实上，医学影像的环节处于整个医疗过程中非常上游的环节，他们眼前的黑白影像世界直接决定着临床决策，其“牵一发而动全身”的效果非常明显，能在这个环节帮助到医生意味着巨大的机会。一旦 AI 协助医生提高了看片的速度，那么现今医护供给、需求高度落差的状况就能得以改善，也会有更多的病患能从中受惠，不论是能够更快速地找到治疗方法还是预防其他病症的产生，都意义重大。

医学影像 AI 同样受到了来自政府的高度关注。 12 月 14 日，工信部印发的《促进新一代人工智能产业发展三年行动计划（2018-2020 年）》通知中，医学影像 AI 就被点名，位列 8 类重点发展的人工智能产品之中（其它7类包括智能网联汽车、智能服务机器人、智能无人机、视频图像身份识别系统、智能语音交互系统、智能翻译系统、智能家居产品）。

更早之前，在 11 月 15 日，科技部则是公布了一份“首批国家人工智能开放创新平台名单”，分别包括自动驾驶、城市大脑、医疗影像、智能语音这四大平台。

从这些动作中我们也发现，医学影像 AI 正迎来种种拥趸，成为医疗 AI 中的“爆款”，但这样热闹的景象，难免会让人忘了医疗其实是一个往往需要“坐足十年冷板凳”的行业，在这一点上，“爆款”也将难以例外。

-End-