近日,科大讯飞智慧医疗事业部总经理陶晓东与常务副总经理鹿晓亮接受了媒体采访,回答了关于讯飞部署人工智能 + 医疗的战略意义、相关产品的研发与落地情况、主要技术突破以及在过程中遇到的挑战等问题,以下是机器之能对采访内容进行的整理。
「中国医疗资源总量不足、分布不合理、优质资源匮乏。看病难、看病贵的问题的核心表现为供需矛盾」,在去年的一次新闻发布会上,卫计委副主任王培安这样向公众解释我国医疗行业现存的问题。同时,在资源严重不足的情况下,医护人员宝贵的时间也并没有得到有效地利用。一方面医生每天要花大量时间在病历书写、医疗影像阅览等重复工作上,另一方面由于缺少有效的分诊机制,医生所看的很多病人都是自己不擅长的,造成严重的资源浪费。正是因为痛点明确,医疗行业一直走在应用新技术的前沿,这一次人工智能技术的爆发也不例外。
科大讯飞利用其在语音识别和计算机视觉方面的技术储备,一直在积极拓展人工智能应用于医疗领域的可能性。早在 2014 年 8 月,科大讯飞就进行了语音技术在医疗行业应用的研究,把语音记录自动转换为文字,生成电子病历,当时在部分医院进行试点但未大规模使用。在 2016 年年中,科大讯飞还与安徽省立医院共建医学人工智能联合实验室。近些年,也先后与北京大学口腔医院、上海交通大学附属第六医院南院等多家医院取得深度合作。
今年 1 月,陶晓东加入科大讯飞高管团队,担任智慧医疗事业部总经理一职,负责智慧医疗领域的技术研发、产品落地及市场推广等工作。陶晓东的研究方向为医学影像,是美国约翰霍普金斯大学博士,电子电气工程师学会(IEEE)高级会员,曾服务于美国通用电气公司(GE)从事医学影像研究,并在飞利浦医疗放射解决方案担任首席架构师。随着陶晓东的加入,科大讯飞的智慧医疗产品线战略也进一步明确下来,其中包括:语音技术在医疗中的应用、智能影像辅助诊断、辅助诊疗系统三大业务。
昨天,科大讯飞智慧医疗事业部总经理陶晓东与常务副总经理鹿晓亮接受了媒体采访,回答了关于讯飞部署人工智能 + 医疗的战略意义、相关产品的研发与落地情况、主要技术突破以及在过程中遇到的挑战等问题,以下是机器之能对采访内容进行的整理:
战略布局
Q:「智慧医疗」对于科大讯飞而言战略意义是什么?目前科大讯飞在医疗板块已经有不少合作进展,是否可以简单讲讲为什么切入到医疗领域,以及选择深入医疗领域的特定细分板块的逻辑是怎样的?
陶晓东:科大讯飞一直以来是一个非常强的技术驱动的人工智能公司,在过去的十几年里面开发了很多的人工智能的算法,最初的切入点在智能语音交互这一块,后来切入到更多的认知智能,包括语义理解。在这个基础上讯飞在过去的十年里面做了很多的人工智能和行业的相结合的尝试。非常成功的例子有这个人工智能 + 教育,人工智能 + 智慧城市等等。
对于医疗这样一个国计民生非常重要的一个领域,我们是从两年前开始切入的,我们也非常有信心人工智能在这个行业里面能够有很大的作为,而且我们也相信科大讯飞现在的技术水平可以在这个行业里面起到一定的作用,推动人工智能 + 医疗行业发展。这是我们进入医疗的战略思考。然后从各个板块之间的逻辑角度,我们从讯飞最强的语音交互技术开始,切入到辅助诊疗这个比较实质的临床的应用里面,然后能够帮助医生一方面提高效率,另外一方面提升诊断治疗水平。用人工智能帮助医生更好地提供医疗服务。
我们选择的几个产品一方面是医院的需求,另外一方面是基于它们之间的逻辑关系。像语音电子病历,我们是从信息的源头保证信息的完整性和准确性。有了完整的信息之后,我们再用过去这些年积累的人工智能的技术,去为医生提供辅助诊断。
Q:之前科大讯飞的技术主要集中于语音识别领域,少量图像识别的产品也是和港中文汤晓鸥团队等合作。智慧医疗中极其重要的一部分是影像识别,讯飞会为此建立自己的计算机视觉团队吗?还是仍然会以平台形式与核心技术开发者合作?
陶晓东:科大讯飞实际上是一家人工智能的公司,只是我们在语音方面做的比较好,因此被贴了一个非常强的语音标签。其实讯飞一直有关注计算机视觉领域,也一直有计算机视觉团队,我们有不少的同事在从事这方面的工作。我们实际上是有比较强的包括人脸识别、OCR 等在内的技术。
在核心技术上,我们一方面会自己内部去开发,另外一方面还会与约克大学、清华大学、哈工大等国内外院校的联合实验室合作,他们都会为我们的核心技术提供强大的支撑。
Q:如今一方面,GE、西门子和飞利浦在医疗设备基础上做了很多软件解决方案上的尝试,另一方面,一些技术公司也开始进入医疗领域,尤其是影像分析领域,科大讯飞的优势是什么?
陶晓东:传统的设备公司和初创公司更多的是百分之百聚焦在影像上面,然而影像只是诊断治疗的一个手段,而不是一个目的。我们如果要最终达到一个诊断结果的话,还需要把其他各种各样的信息跟影像结合起来。这是我们跟其他公司出发点的不同。我们的优势还是我们有大量的处理大数据的经验,和处理结构化和非结构化混合的数据的经验。
鹿晓亮:讯飞做医疗影像的视角不同,影像科的医生在看影像的时候,不仅需要看片子,还要了解很多这个病人的家族史既往史等其他信息,它是一个比较综合的多模态的数据输入,所以我们做医疗影像这块的策略和技术方案也是这样。我们的系统不仅要能够处理这个人的胸片或 CT 影像,还要同步处理他的其他非结构数据,把这些数据融合在一起,最后帮助医生做一个整体的判断跟方案的建议,这个是我们做影像这块跟其他公司的最大的不同。
Q:科大讯飞智能影像的开发思路为:「在成像方法、充分利用临床信息指导成像和辅助阅片等方面进行研发,并将人工智能相关技术建立在医学知识的完备体系之上,形成更为系统、更具临床价值的技术产品。」这又说明科大讯飞的路径与其他做法有什么不同呢?
陶晓东:传统的这种智能影像的领域里面的很多算法都是黑盒子,即使能够达到一个还不错的准确率,算法本身也没有办法解释到底为什么能够达到这样的准确率。所以我们希望能够把这些智能影像的算法建立在一个相对比较完善的医学知识体系上面,通过对医学的理论学习去掌握相关技术。比如说解剖学,我们把医学的本科教材,通过机器学习的方法和各种各样的医学知识之间的联系建立起来,因此我们的系统能够知道什么样是正常的,什么样的表现是病灶,而且医学常识和物理模型结合之后,我们是可以有一个相对比较完善的一个医学知识体系,可以系统地去分析我们的图像到底为什么会有病灶,而不是简单的一个「黑盒子」进去,出来结果,里面的很多的中间的过程我们看不到。这是我们的一个思路,就是算法能给出这个诊断的依据。
产品研发
Q:人工智能辅助诊疗系统的研发及落地情况现在怎么样?
陶晓东:辅助诊疗系统的构建依赖于很多的行业大数据,而且需要不断的和行业专家进行交流沟通,找到能够真正的帮助医生日常工作的切入点。现阶段,我们主要在以下两个方面进行研发:一是医学知识体系的构建,二是把各种医学相关的信息结合,在影像方面去做辅助诊疗,帮助医生在日常工作中提高效率和提高准确性。
Q:导诊机器人「晓曼」是讯飞智慧医疗各产品中最接近患者的一个,现在有哪些进展呢?未来有什么计划?
鹿晓亮:我们的机器人具备两个比较基本又非常刚需的功能,一个功能是医院的导航,另外一个是导诊,目前在北京 301 医院、上海瑞金医院已经正式投入使用了。我们统计到,今年春节之后,在 301 医院我们的一个机器人每天的交互达到 2000 多次,服务人次大概是六、七百人次。一般来说,一个导诊护士每天的服务量大概是 800 多人次。现在导诊机器人能在很大程度上辅助护士的工作,极大地缓解了医院里面导诊护士的工作量。
我们下一步要做一个跟人工智能算法结合在一起非常有用的一个功能,就是我们的系统要做到一个精准的分诊,现在许多医生或者专家,每天所看的患者大概有 70% 都可能是他们不擅长的。这其实是患者挂号比较随意,因为他们也不太清楚到底哪个医生在某个领域可能是最擅长的,就导致这种不匹配,造成严重的医疗资源的浪费。所以我们下一步就是要通过大数据的挖掘,包括这个病人跟机器人口述的一些症状或者一些疾病,跟专科的数据做一个精准的匹配,实现有效分诊。
Q:在语音电子病历方面,我们看到了讯飞与许多医院的合作案例,能和我们分享一下相关经验以及接下来会有哪些动作吗?
陶晓东:语音录入病历方面,我们跟医院合作比较成功的案例都是我们能够切实地解决医生的一些工作中的问题,包括效率问题,还有和把他们从繁重的文书工作中解放出来,让他们能够有更多的时间去真正花在诊断治疗,和创造性工作上面去。讯飞医疗团队成立做的第一款产品就是语音录入,我们派出了大量的产品经理在一线跟医生来磨合。
我举一个简单的例子,讯飞在跟北大口腔合作的时候,我们就在想,口腔科医生要录入一些关键信息的话怎么去启动录音。我们跟北大口腔的医生还有专家讨论了很多方案,比如说在麦克风上设计一个按钮,甚至我们连脚踏板都考虑过。但是我们讨论来讨论去总觉得这样的一个设定会对医生的工作流程有很大的影响,医生要记着他什么时候该录音了什么时候该结束了,这对医生来说很不方便。所以我们就从医生的使用角度出发,最后把设定录音开关的想法抛弃了,我们用全程录音的方法把各种问话、闲聊、病史语音全部录下来,交给算法做分类,不需要让医生来配合。
Q:影像分析产品目前的研发及落地情况如何?主要针对哪些种类的疾病呢?
陶晓东:我们现在不是只用影像,我们更关注的是怎么样把影像和其他的一些信息结合起来,然后帮助到医生的临床工作。研发工作包括传统的影像分割、影像的配准、各种基于影像的测量,同时也包括如何将影像的数据和其他的结构化 / 非结构化的数据相融合,以及相应人工智能的算法的开发。目前我们在多个病种里都有探索,我们最开始是在这个肺结节的筛查上做工作,因为该问题在开放域里数据最多。其他方面,像脑部的核磁、腹部的核磁、心脏超声,以及其他的一些可以通过 CT 检出的疾病,我们都在做一些工作。关于影像产品的落地情况,我们现在在一些医院里面有试点,现在有相对比较成熟的肺部病灶检测,此外也在和一些合作医院一起再继续磨合更优化的产品。
Q:电子病历在国内一直没有特别有效的突破性进展,尤其是各个医院之间相互不开放,虽然一些医院构建了医联体模式,也看到一些新兴医院集团的出现,但整体上来说基础并不是特别好,因此在推广语音电子病历方面,你们遇到什么难题吗?如何解决的?
陶晓东:电子病历方面困难还是很多的。一是因为门诊医生的工作量是非常大的,每看一个病人可能只有大概五分钟左右的时间,过程中要问诊,病人回复,还要做记录,做各种各样的判断。这个是为什么电子病历使用率不是很高。另外大家都认可的、有利于医院信息交换的电子病历的标准,相对来讲还不是特别完善,这让我们的推广过程中也会有比较大的问题。
从解决上面的问题的角度,我们更愿意跟整个行业一起去把电子病历的规范做起来。因为电子病历是电子健康档案非常重要的一环,没有电子病历,电子健康档案就不完整,双向转诊分级诊疗就很难做。医院间信息不通的话,这部分也很难做。医联体可能是一个比较好的模式,至少在内部会有相对比较规范的的数据交换方式。
技术力量
Q:讯飞在与医院合作的过程中,如何保证患者的医疗数据安全?对于医疗影像诊断识别来说,许多模型需要大量且标记清晰的数据进行训练,如何获得这样的数据呢?
陶晓东:从数据安全方面来讲,我们是和医院配合,绝大多数数据都在医院系统中,我们只有使用权,我们并不会把它拿到医院外。另一方面,如果我们需要一些数据去做验证的话,肯定是一些脱敏的数据,在医院的数据安全的监管下使用。
在大数据方面,从传统的意义上来讲,大家都认为人工智能的算法需要大量的数据。实际上这跟算法相关,在特定情况下,数据并不是越多越好的。而且很多算法在开始开发阶段并不需要很多标注的数据。有各种各样的人工智能的学习算法是可以在相对标注并不是特别清楚的情况下,就能够做到一个可用的程度,之后在实际的使用中不断地去优化。所以我们现在一方面在找更多的数据,另一方面我们更多地在算法的角度来弥补近期数据不足的问题,因为医疗的数据相对来讲是比较难获得的。
鹿晓亮:目前比较流行的深度学习这个概念,普遍被认为需要跟大量的数据结合在一起,机器需要学习很多的东西,然后才具备一些辨识能力。讯飞现在希望我们的人工智能算法不需要处理、学习那么多的资料或者是原始的数据,就能够具备比较强的辨识的能力。其实讯飞在这方面已经有了很大的进步,我们现在也正在把这样的一些技术应用在医疗影像里边来。虽然我们肯定是需要比较多的数据,但是没有想象的那么多,我们正在用算法的方法来改变。
Q:您之间提到讯飞的特点是擅长处理结构化和非结构化的数据的结合,能具体谈一下这个过程吗?
陶晓东:影像是诊断的一个信息来源,但不是唯一的一个信息来源。医生在诊断的过程中也要依赖于其他的很多的临床信息,比如医生对片子有疑问的话,他可能会去给临床医生打电话,然后确认病史信息、病人来就诊时候的一些情况。所以这是为什么我们认为单纯从影像入手可能不是唯一路径。
结构化和非结构化数据的整合其实还是蛮困难的,这里的难点在怎么样把这些数据放在一起分析,结构化和非结构化数据在这种复杂的数据结构的情况下,需要很多的积累,然后才能够做好。
Q:如果一个医院应用采纳了公司的智能影像系统,之后还要根据实际反馈不断升级模型,这些工作还需要 AI 公司来做吗?会不会感觉是个负担?如何收费呢?
陶晓东:我觉得像任何一个产品一样,在产品的设计过程中是需要考虑一些未来的模型和硬件的升级问题的。包括硬件的升级、包括未来可能的运算能力提高。但是你肯定不可能考虑到全部,所以在这个角度来讲,确实有一些升级迭代的事情是需要公司来做的,另有一些我们在产品的设计过程中就做到,然后客户可以自己去做升级。
鹿晓亮:从技术角度来说,其实讯飞的一些技术开始慢慢支持半监督或者无监督的学习方法,就是说我们后续在医院里边部署的一些服务会具备自动升级的能力。其实现在讯飞的云平台上已经具备这样的一些能力了,不需要模型升级、不需要工程师到现场去做部署。我们只要在现场有训练的环境,它可以根据我们医院内的新的数据,做自动的模型参数的迭代和优化。
Q:6 月 10 日,您也参加了上海的人工智能与病理切片诊断专题报告会,会上有专家说人工智能进行临床诊断不靠谱,您对此怎么看?您觉得达到靠谱要多久?
陶晓东:我其实跟朱教授是有一些交流的,他的本意是人工智能进行临床诊断,在没有监督的情况下,是不靠谱的。这个观点我是同意的。我们一直以来的观点是人工智能仍然是一个工具,它可以辅助医生去做一些事情,但是顶级专家近期很难被人工智能替代掉。可能是一些简单重复的工作或相对比较容易的工作是可以被 AI 替代掉。科大讯飞在人工智能这个行业里面也走了很多年了,还是比较了解人工智能做什么,不能做什么,这些都充分体现在我们的产品开发思路上面。人工智能能做很多的事情,但是人工智能不能做所有的事情。所以我觉得这个「靠谱」要看我们想要做什么,有些事情可能我们今天就能做,有很多事情可能我们要过五年才能够变得靠谱。
鹿晓亮:讯飞的人工智能在医疗以及所有的行业中的应用,我们的定位是非常明确的,就是不是说要去替代人类,比如说我们的医疗影像这样的系统不是要去代替医生的,还是要辅助医生。
Q:影像 CAD 发展很多年,一直没有得到广泛的认可,为什么?人工智能这一波浪潮能否真的将技术从实验室搬到实际应用中?如何做到?
陶晓东:对 CAD 的质疑有很大的一部分是来自健康经济学角度。因为 CAD 的普及的话会带来大量的早期筛查,早期筛查之后实际上可能大量的是阴性病例。然后这个费用其实还是蛮高的,你为了发现万分之三的早期癌症,最后对一万个人都做了筛查。整体来说,CAD 对早诊早治肯定是有效果的,因为他其实能够解决受限于人工的一些漏诊误诊问题。现在的人工智能,包括整个影像技术的发展,实际上是把这个成像和图像分析的成本降得越来越低,所以在我觉得人工智能的下一个贡献可能会把这个 CAD 的整个成本降得很低,然后从健康经济学角度变得可接受。
国内外环境差异
Q:国内外做智慧医疗不太一样,您回国以后的视角有何变化?对国内国外智慧医疗发展的差异化判断?
陶晓东:我觉得国内慢慢会过渡到所有的医疗数据归国家所有。现在国家的各种政策,是希望把这个数据集中起来,因为这样的话,能够把这些数据和数据交换的标准建立起来,这样做的价值是非常大,所以我觉得这是非常正确的一个方向。
在美国,所有的数据所有者是病人本身。然而实际上每一个人享受的医疗服务是建立在前面的某些人贡献出自己数据的基础上的。当然这里面敏感信息是另一回事,如何保证隐私的情况下把数据共享,在美国也有很多人在探讨,尤其是一些大病康复之后的数据更有医学价值。
所以我觉得大家可能会向同一个方向去努力,最终的数据实际上是社会共有的财富,然后在这个基础上去做医学研究,包括基础的科研,还有临床的科研,对医学领域的进展实际上是会起到一个加速作用。
Q:国内外都做智慧医疗的情况下,面对的挑战有何不同?
陶晓东:技术层面美国可能还有一些领先优势,但是在应用层面上已经没有明显优势了。从中国的角度来讲,各个医院之间的这个信息的互通是一个问题。在中国相对来讲缺乏这样一个规范,所以在数据交换上会存在一些障碍。此外,在美国的话,个人是有一个相对来讲比较固定的家庭医生,他基本上是你这个人的所有健康问题的项目经理,但是在中国,在家庭医生制度完善之前,实际上很难有这样一个人知道你所有的健康档案,每一个人的健康档案实际上是被分成若干片,这部分可能是我觉得近期相对来讲比较大的一个挑战。怎么样把病人的健康档案、既往病史做电子化、做规范化,然后去做数据交流以便进行更好的病情分析。
Q:讯飞会做哪些工作以推动行业标准的建立?
陶晓东:第一是我们的技术做得比较好,第二是我们的产品设计过程充分考虑了医生的实际的使用场景,技术和产品这两个方面做好了之后,我相信我们会有更多的客户,越来越多的医院和医疗机构认可我们,我们也会获得更多的话语权,从而致力于推动行业标准的建立。
Q:医院方面技术提供商竞争的激烈程度如何?
陶晓东:现在的竞争激烈程度肯定要比 3、5 年之后要激烈得多,大家是都在都在用 AI,确实有技术在落地,也有很多实际上还处在研发过程中。我觉得就是在推广的过程中,医生的主要经验是在临床应用方面,而我们的更多是在技术方面,怎么样把这两个东西拉到同一个层面上去交流,让医生对 AI 既没有不切实际的乐观态度,也不觉得 AI 对他的工作没有用。我们是努力的去发现真正能帮助医生解决临床问题的一些领域,然后在这方面聚焦,真正做到能够融入他的工作流程中去。所以推广中一个比较大的困难就是如何把人工智能和医疗健康这两个行业之间的交流变得更加顺畅,这个是相对来讲比较大的一个挑战,让技术更好地服务于医生的工作。
本文为机器之心原创,转载请联系本公众号获得授权。
✄------------------------------------------------
加入机器之心(全职记者/实习生):[email protected]
投稿或寻求报道:[email protected]
广告&商务合作:[email protected]
点击阅读原文,查看机器之心官网↓↓↓