专栏名称: 36氪
36氪(36Kr.com)是中国领先的科技新媒体,我们报道最新的互联网科技新闻以及最有潜力的互联网创业企业。
目录
相关文章推荐
新浪科技  ·  【#如何用AI对抗麦学##AI对抗麦学也没什 ... ·  2 天前  
新浪科技  ·  【#雷军周鸿祎乌镇峰会10年全勤生# ... ·  4 天前  
新浪科技  ·  #听泉赏宝月薪20000招带货主播#【#听泉 ... ·  6 天前  
51好读  ›  专栏  ›  36氪

扫描145家中美创业公司:梦想更大,还是坑更大? | 医疗人工智能报告

36氪  · 公众号  · 科技媒体  · 2016-09-20 08:45

正文



由于医疗资源的短缺以及成本支出的快速增加,医疗人工智能存在着切实的需求。但美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。


从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。


但医疗数据的获取、医疗本身的复杂性和人力物力财力等方面的巨大投入,都将成为这个领域的巨大挑战。




文 | 刘涌



医疗领域人工智能的应用,激发了人们对未来的许多想象。计算机的运算速度快、储存量大、质量稳定且不知疲倦,如果能够在医疗领域应用,必将能够大大提高医疗质量和供给量,并最终降低医疗成本。加上商业前景的光环,医疗人工智能的探索真可以说是“引无数英雄竞折腰”。


但梦想照进现实,总需要一条切实可行的路径。有人认为路径很清晰,用“医疗大数据+算法”来训练机器人,就可以实现人工智能,无非是积累和获取数据的问题。但有人认为路上的坑很多,因为医疗太复杂,未知太多,尤其还事关人命。


讨论和思考都在继续,行动也在全球范围内轰轰烈烈的开展起来。我在这份报告里梳理了145家中国和美国在人工智能大方向上的创业公司,他们中的很多已经受到投资人的热捧。不仅如此,IBM和Google这样的巨头也都涉足医疗人工智能。尤其是IBM的Watson,更是已经在全球范围内的医疗机构当中付诸应用。


真正的重点是,这些先行者的实践究竟具有哪些更普世的价值。他们已经探索和尚未探索的领域中,究竟还埋藏着哪些机会。尤其是,那些若隐若现的坑究竟又在哪里,克服困境的方法已经找到了么?毕竟,在过去五十年有关医疗人工智能的探索都收效甚微的背景下,今天的创业者究竟可能面对怎样的未来?


于是,我在这篇文章里对医疗人工智能做了一个系统的分析,重点希望解决这样几个问题:


  • 现实医疗真的需要人工智能吗?又有多需要?


  • 关于医疗人工智能,已经做过什么,又做成了什么?


  • 在医疗人工智能当中,有多少不同类型的尝试?


  • 究竟人们口中的那些坑是什么?


医疗的创业创新正经历一个瓶颈。与其他领域的资本寒冬不同,医疗创业面临瓶颈的原因是这个领域本身门槛很高又太过复杂。在一个行业困境时唱衰它,只不过是哗众取宠、秀智商下限的行为。改变不是不可能,只是需要时间。所以,我一直保持着积极的心态,与这个行业里最坚持的创新者、投资人交流,期待能够在他们的思考中找到任何一个改变的可能。这也是我写本系列文章的由来。以下我们进入正题。

目录


Part.1 序章


  • 1.1 关于医疗人工智能的讨论范围

  • 1.2 医疗人工智能的现实需求


Part.2 医疗人工智能的五十年现实


  • 2.1 早期医疗人工智能的尝试

  • 2.2 早期医疗人工智能尝试的局限性


Part.3 Watson的意义


  • 3.1 Watson成长史

  • 3.2 Watson商业化

  • 3.3 “学以致用”Watson


Part.4 82家美国公司和63家中国公司


  • 4.1 82家美国公司

  • 4.2 63家中国公司


Part.5 医疗人工智能的条件具备了吗?


  • 5.1 坑One:训练机器人的医疗数据从哪里来?

  • 5.2 坑Two:医疗问题太过复杂!

  • 5.3 坑Three:工作量巨大无比


Part.6 总结和讨论


  • 6.1 一些总结

  • 6.2 一些讨论



Part.1 序章


1.1 关于医疗人工智能的讨论范围


人工智能火得烫手。前些天一个同事说他下午刚报道了一个人工智能方面的项目,当天吃晚饭的空里就有二十家投资机构上门要联系方式。这种火法让人依稀看到了曾经O2O的影子,但愿历史不要重演。同样,医疗领域在这股浪潮中也到了一种神魂颠倒的地步,“智能”二字几乎已经是每家公司产品的标配。可是,当我们在讨论人工智能的时候,我们究竟在讨论什么?


首先,我们来对医疗领域人工智能的应用做一个基本的设定:


①关于人工智能在医疗当中应用的终极想象,当然是电脑能够替代人来为患者诊断、治疗。这个理想并不是刚刚出现,至少可以追随到上世纪六七十年代。只不过实现起来,理想与现实的差距太大。


②比直接用电脑替代人来看病的难度略低一些的是临床决策辅助系统(Clinical decision support system,简称CDSS),这是目前尝试比较多、发展也相对比较快的领域。


③在实现人工智能的道路上,一个必备的条件是积累医疗大数据。所以,在人工智能创业领域的一个“近亲”,就是医疗大数据积累、挖掘和应用。也可以将其看做是实现人工智能的一个中间环节。


④向前再推进一步,就是获取数据的问题。从医疗机构获取数据是一个路径,而且无捷径可循;另外一个就是从患者端获取数据,特别是通过可穿戴硬件来获取患者的健康数据来实施健康管理。


从目前已经观察到的情况,有关人工智能在医疗领域探索大体有这么四种类型。如果单独讨论某一种类型,恐怕都不能完整的反应医疗领域人工智能的进展。所以,本文在讨论人工智能的过程中将采取最广义的概念,包含前述的四种类型。


1.2 医疗人工智能的现实需求


人工智能的火究竟是虚火而昙花一现,还是方兴未艾、志存高远。况且,医疗是否真的需要人工智能,还仅仅是跟风?有关这些问题,可以从以下几个方面来分析:


首先,医疗领域最突出的问题就是优质医疗资源不足。这个问题不止中国存在。美国这几年就经常爆出医生短缺的消息,最近还有预测说美国未来十年会短缺6到9万名内科医生。老龄化比较严重的日本也面临这个问题的困扰,每千人口中仅两人从医。就连每千人拥有4名医生的瑞士,近年也开始重视医生数量不足的问题。而医疗资源不足的问题,在我国还会因为分布不均而加剧。

资料来源:OECE,国家卫计委,2014年


再加上人口老龄化的加剧,未来对医生的需求量很有可能是有增无减。解决医生资源不足的问题,在增加供给量方面,培养医生需要周期;而调整结构则需要配套政策。或者简单的说,靠人来解决这个问题需要很长的时间,而且供给量也不是无限增加的。于是,人们开始寄希望于机器。因为一旦能够实现机器看病,供给量将会是无限增加。


解决医疗资源不足,恐怕是对人工智能的最根本需求和发展动力所在。而医疗领域面对的另外一个问题就是费用支出持续增加,财政支出和社会负担的压力越来越大。医疗负担上升是多种因素共同促成的结果,包括人口老龄化、慢性疾病增长、新技术的采用等。

资料来源:OECD


人工智能在解决成本压力方面被寄予厚望有几个方面的原因:一是通过人工智能提高患者自查自诊自我管理的比例,降低医疗支出;二是通过人工智能手段实现更早期发现、更好管理,减少后续的医疗费用支出;三是通过人工智能手段提高医疗机构、医生的工作效率,降低医疗成本;再有就是通过人工智能制定科学合理的健康医疗方案,减少不合理的医疗支出。


此外,还有一些虽然不是急性且刚性的需求,也提高了人们对人工智能的期待。比如机器的运算速度、准确程度、更新速度、稳定性都要好于人工。比如肿瘤领域的研究论文,2009年到2013年,全球共产生了16万份肿瘤相关的研究,平均每年3.2万份。而到了2015年,这个数字已经达到了4.4万份,平均每天就有超过120篇新的研究发表。显然,这已经远远超出人类认知能力的范围。


综合这些因素,人工智能在医疗领域的应用,不仅有可能解决医疗资源短缺、成本支出增加的困境,而且还有可能带来医疗能力、医疗体验上的提升。从这两个方面的需求来看,人工智能在医疗领域确实拥有相当广阔的成长空间。



Part.2 医疗人工智能的五十年现实


从现在面向未来,库兹韦尔曾做出过预测,人工智能的水平超过人类智力的水平将在2045年出现。20多年后,奇点就将来临的猜想让很多人觉得过于疯狂。实际上,人类对人工智能的想象,至少已经有80年。1936,阿兰.图灵就提供了机器模拟人类数学运算的构想。二十年后,达特茅斯会议将人工智能确定成为一门科学。人类由此开始有计划、有目标的朝人工智能的目标努力。


2.1 早期医疗人工智能的尝试


从1956年之后的二十年里,人类雄心勃勃。后来AlphaGo算法核心内容的雏形就在这个时期出现,即贝尔曼公式。而最早的一波在医疗领域进行人工智能探索的尝试,也在这个时期出现。1972年,由利兹大学研发的AAPHelp是资料记载当中,医疗领域最早出现的人工智能系统。这个系统基于贝叶斯理论开发,主要是用于腹部剧痛的辅助诊断以及手术的相关需求。


在随后的整个七十年代当中,又产生了不少新的成果。INTERNIST I 于1974年由匹兹堡大学研发问世,主要用于内科复杂疾病的辅助诊断。这套系统在当时被认为极具价值,并于80年代在其基础了开发了CADUCEUS和QMR系统,开始了商业化尝试。MYCIN于1976年有斯坦福大学研发,主要用于血液感染疾病的辅助诊断。


此外,还有罗格斯大学开发的CASNET/Glaucoma,MIT开发的PIP、ABEL,斯坦福大学开发的ONCOCIN等。而且上世纪80年代,已经有一些商业化应用系统的出现,比如前面提到的QMR(Quick Medical Reference),还有哈佛医学院开发的DXplain,主要是依据临床表现提供诊断方案。DXplain的知识库中,已经收录了2200种疾病,和5000多种症状。

2.2 早期医疗人工智能尝试的局限性


事情并没有预期的那么顺利。在随后很长的一段时间里,人工智能在医疗领域当中的应用并没有取得特别明显的突破。人们所期待的机器替代人看病的场景并没有出现,反而越来越多的看到人工智能在医疗领域当中应用时的局限性。


在医疗服务当中,临床诊断是最为关键的环节。而对于临床医生来讲,只有当计算机能够达到“专家”的水平时,也许才会应用。但诊断的过程过于复杂,存在着大量的“变量”。即便是专家本人的诊断,亦有相当多的不确定因素。这样的话,对于人工智能的开发则需要理解专家从症状到做出诊断整个过程的逻辑,同时还需要将这种能力“教会”计算机。


再有,现在人们越来越多的认识到,要让医生愿意采用人工智能的系统,必须能够有效的将新系统合适地整合到医生原有的工作流当中。而且其实特别重要的一点是,需要让医生们相信,人工智能可以帮助他们改善临床效果、提升工作效率。但目前有关这一点,似乎并不是那么确定。


德国夏里特医院的学者曾经对辅助诊断系统在五年应用当中,针对抗生素滥用的效果进行了研究。结果显示,辅助诊断系统对抗生素滥用和临床诊疗的改善起到了不错的效果。


但也有不少研究的结论,则并不让人那么乐观。比如米兰大学在2014年的研究得出结论称,辅助诊断系统并没有明显对死亡率产生影响;而伦敦帝国学院的在2011年对过去13年数据的研究则显示,计算机在医疗领域的应用现实与理想状况差距很大,并且迄今为止,没有坚实的证据能够表明辅助诊断系统能够降低医疗成本并改善患者的治疗效果。


总的来说,医疗人工智能方面过往的大多数探索都并不成功。不过,这样的现状只能说明医疗的高度复杂性,并没有阻止人类在医疗领域探索人工智能的尝试。实际上,IBM研发的Watson机器人医生就在一路高歌猛进。除了技术本身的进步之外,Watson的实践本身还有怎样更重要的意义?



Part.3 Watson的意义


IBM在人工智能上的突破也不过是在最近十年当中取得的。1997年,“深蓝”战胜象棋大师卡斯帕罗夫之后的很长时间里,人工智能在辅助工作方面取得了很大的进展,比如处理繁琐的公司文件。但距离真正意义上的人工智能,相去甚远。以至于当挑战“Jeopardy!”的提议第一次出现在IBM的时候,甚至引来嘘声一片。


《纽约时报》记载过一个故事,2006年,IBM测试自己的最先进系统在“Jeopardy!”当中的表现。结果人类冠军答题的正确率是85-95%,而IBM系统的正确率却仅有15%,显得愚钝不堪(slow and dumb)。语言识别是当时人机对话的主要困难。然而仅5年之后,以IBM创始人托马斯.沃森命名的Watson机器人就在“Jeopardy!”当中击败了人类冠军。


这可以算是Watson“医生”的前传。很快,IBM就将Watson应用的重点转移到了医疗领域。

IBM从上世纪开始就对医疗心心念念,资料来源:动脉网


3.1 Watson成长史


在这次突破之后,吸取了深蓝教训的IBM开始了将Watson推向商业化应用的尝试,而健康成为了他们确定的重点方向之一。那么IBM“训练”Watson的教学方法是怎样的?2014年1月份,Watson“自立门户”,并推出Watsonfoundation将认知计算技术与大数据分析技术结合起来,奠定了整个Watson运作的基本逻辑。而Watson在健康领域的推进则是从2014年底开始的。


首先是Watson先后与苹果、强生和美敦力三巨头建立的合作。Watson和苹果的合作包括两个层面,一个是基于Healthkit面向普通用户的数据采集和储存,另一个是基于Researchkit面向研究人员的数据分析;与强生的合作主要是在关节、脊柱术前和术后的患者护理,以及慢病管理;与美敦力的合作,主要是通过美敦力的医疗器械采集糖尿病患者的数据,并为他们提供个性化的管理方案。


第一步还只是合作,很快IBM就掏出了真金白银。2015年,IBM一举并购了两家医疗大数据公司Phytel和Explorys。Phytel公司主要是应用云工具,帮助临床医生为患者提供质量更好的医疗服务。而Explorys最初则是由克利夫兰诊所发起成立的公司,主要为医疗服务机构提供数据管理,服务全美360家医院,拥有超过5000万个患者的医疗记录。

Explorys的患者数据覆盖


完成了这两家公司的并购后,IBM Watson Health正式成立。不过IBM的并购却并没有就此结束,2015年8月,IBM斥资10亿美元收购医疗影像数据公司Merge Healthcare;2016年2月,IBM又花了26亿美元收购了健康大数据公司Truven Health Analytics。


Merge是美国的一家老牌医疗影像公司,用户包括7500多家医院、科研机构、药企等。并购完成之后,Watson还将应用Merge的技术分析已经储存的超过三千亿个医疗影像数据。Truven Health Analytics服务超过8500个用户,拥有超过2亿名患者的诊断和医疗支出的数据。


到这时为止,IBM在不到一年的时间里在并购上投入了40亿美元,给Watson补充不同类型的数据和分析技术。投入之大,足见Watson的“饥渴”。

资料来源:dt财经


3.2 Watson商业化


现在Watson已经相当强大,能够读懂非结构化数据,而且能够在15秒内阅读完成4千万份文件。Watson需要商业化,只掏钱肯定是不行的,要赚钱就要尽可能扩大应用的范围。而从IBM的应用推广来看,除了在他们的北美大本营之外,Watson在亚洲的应用推广进展非常好,在中国和印度两个人口大国都有所斩获。


2014年10月,IBM宣布与东南亚地区最大的私立医院康民国际医院达成合作,Watson将为康民医院位于曼谷的医疗中心和其他16个国家的转诊办公室提供服务。


2015年5月,在Watson Health成立后不久,IBM就宣布,14家美国和加拿大的肿瘤医院将引进Watson,通过患者的基因测序数据来提供适当的治疗方案。


2015年12月,IBM宣布与印度的第三大医院Manipal Hospitals达成合作,Watson将帮助肿瘤医生为患者提供诊断和治疗。每年,有超过20万肿瘤患者在Manipal Hospitals医院接受治疗。


2016年8月,Watson落地中国,与中山大学附属肿瘤防治中心、中国医科大学附属第四医院、浙江省中医院、复旦大学附属肿瘤医院等21家医院达成合作。杭州认知网络是Watson在中国的本地服务商。


此外,Watson在医疗领域还与Talkspace、Welltok、hc1等新兴的移动医疗公司建立了合作。Watson将基于这些应用的数据采集,来为他们的用户提供相应的医疗服务。

资料来源:哈佛商业评论


3.3 “学以致用”的Watson


总结起来,IBM Watson的整个发展历程可以概括为“学以致用”。


在Watson发展早期,IBM豪掷亿金接连并购4家拥有医疗大数据的公司。而在此之前,Watson的“早教”阶段,IBM也是一直抱着梅奥诊所、MD安德森、纪念斯隆—凯特林癌症研究中心、纽约基因组研究中心等美国几家王牌医疗机构的大腿。


这个思路也被Google的DeepMind延续了下来。今年六月的信息,DeepMind与NHS达成了合作,能够获取超过160万患者的医疗健康数据。而很快就有类似MedConfidential这样的组织质疑Google获取患者数据的正当性。


相比于学,用的部分同样重要。尤其是让医生相信人工智能的作用并在实践当中应用,这个过程仍然需要大量的市场教育。而从IBM的策略中也可以看出,选择肿瘤这种刚需又优质医生短缺的领域是其重点方向。Manipal Hospitals的CEO Dr. Ajay Bakshi谈到,在印度平均每位肿瘤医生要服务1600名肿瘤患者,而且随着肿瘤发生率的上升,这种短缺还将加剧。另外,在中国市场,IBM也很明智的选择了本土的运营商来做市场开拓。


但Watson也并非没有问题。Watson主要解决的是肿瘤领域的疾病,尤其是肺癌、乳腺癌、结肠癌等。这几种癌症虽然日渐高发,但究竟Watson会有多大的用武之地是存在疑问的。除非Watson能够成为诊疗路径的一部分,但这恐怕又是难上加难。



Part.4 82家美国公司和63家中国公司


尽管Watson和DeepMind有IBM和Google这样的强大靠山,但他们在医疗领域也仅仅是入门级。众多医疗创业公司还有巨大的成长空间。本节,我们对中美两国在人工智能领域的创业公司做了一个基本梳理。其中,包括美国的82家公司,中国的63家公司。美国公司的数据主要参考了CBinsights的整理,而中国公司的数据则主要来自公开报道。


对这些公司的梳理首先遵循了我们最初设置的定义,即广义人工智能。从数据监测、采集、分析、应用、辅助诊断到电脑医生,各个类型的公司都在其中。


4.1 82家美国公司


首先来看美国公司。整体上,82家美国公司分成了7大类,分别是医疗影像类、健康管理类、医疗服务类、机构信息化、药企研发类、医疗大数据以及基因检测。当然这是个很粗的分类,每种公司的类型和归属并不是那么清晰。分类只是帮助我们认识,有哪些角度可以成为人工智能探索的切入点。以下来逐一分析:

医学影像类:美国公司在影像领域主要也是基于人工智能、深度学习的技术,帮助医生更快更准确的读取病人的影像数据,以更好的做出诊断。CBInsights的判断,这个领域的创业公司正越来越多。2015年以来,已经有17家公司完成首轮融资。这至少说明,影像分析这个事儿是被美国投资者认可的。


健康管理类:这里主要把对个人的健康管理和以个人用户为主的可穿戴设备,都归入其中。这类公司主要是根据用户个人的健康数据来预测疾病风险、提供健康管理方案。总体看,这类公司在美国也并没有出现什么新的花样。不过,这倒是在医疗人工智能领域少有的直接to C的服务。


医疗服务类:这在医疗服务方面应用人工智能的尝试是最多的。这类公司包括两类,一类是由医生提供在线的咨询服务或机器版的手机医生;另一类就是通常所理解的临床诊断辅助系统,包括早期筛查、诊断、康复,手术风险监测,用药安全等,而且会分不同领域,比如血液、睡眠、神经、心理等。


机构信息化:这类公司主要是通过数据监测和分析的方式,帮助医疗机构提升运营效率和诊疗效果,降低支出成本。美国的医疗机构市场化占主导,而且商业保险公司发育比较充分,这些因素也促使医疗机构更加注重效率和成本的,为机构信息化类的创业公司提供了市场空间。


药企研发类:新药研发的需求特别明确,就是解决成本高、周期长的问题。有研究显示,一种新药研发的成本已经接近26亿美元,平均需要10-15年的时间。瞄准这个痛点的创业公司,就是希望通过应用大数据和人工智能的技术,来帮助药企缩短研发周期、减低成本。

资料来源:Nature


医疗大数据:这个分类相对比较模糊,因为实际上其他几个类型都离不开医疗大数据。不过,这类公司相比而言更加注重数据本身的研究和分析。比如鼎鼎大名的Flatiron,就是搭建肿瘤大数据平台、累计肿瘤患者数据,并通过对数据的研发和分析服务临床、科研、新药以及患者治疗。


基因测序:基因测序公司这里列举的比较少。这类公司有点“跨界”的性质。基因测序实际上是人体本身的数据化,并通过对这些数据的分析提供精准治疗。但基因测序的数据由于与通常的医疗大数据含义不一样。但也可以理解,未来人工智能和精准医疗在基因测序这个环节上,也许是连通的。


总体来看,美国创业公司主要面向药企、医疗机构等B端提供服务。而且,这些服务仍然主要是在辅助诊断系统、大数据挖掘等方面,可见美国整体上在人工智能上的探索进展也比较有限。


4.2 63家中国公司


与美国公司类似,中国公司的大体分类也包括医疗大数据、机构信息化、医疗医保类、医学影响类、医药研发类、健康管理类和基因测序了。这61家公司仅是统计到的部分创业公司,也欢迎各相关领域的创业公司主动与我们联系寻求报道([email protected])。

同美国公司相比,中国公司大体上呈现了这么几个特点:智能化程度不够高,不少医疗类的项目主要还是在线咨询服务;to C类产品仍然占据大多数,B端服务开发不足;医疗机构信息化领域比较活跃,主要是解决机构信息互联互通的问题。


对比美国的公司,中国在医疗人工智能上还有哪些成长的空间:


首先是辅助诊断系统,应用人工智能为医生诊断提供帮助,提高效率和准确性。中国公司目前与医疗机构打交道更多仍然是获取医疗资源,提供简单的在线咨询服务。但这种对互联网的应用方式,已经显得普及化、大众化,渐渐失去了商业价值。


第二是服务医药器械企业,降低药品和器械的研发成本、缩短研发周期。实际上,中国公司不缺乏服务药企的的项目,但大多数仅仅是应用互联网做药品营销。虽然这也是一个赚钱的业务,但相比直接服务新药研发,仍然显得技术含量不足。


第三是医学影像,这里包括普通的影像,也包括病理、放疗涉及到“读片”的大影像概念。IBM收购Merge表明,读懂影像类数据对人工智能的发展是有价值的。而且美国过去一年的投资记录也可以看到,美国投资人对影像类人工智能的应用也比较看好。


总体上,中国公司在医疗人工智能方面的探索仍然逊色于美国。但这也许是多种因素作用的结果。而中国因为人口庞大而在医疗大数据上的巨大优势,还没有充分发挥出来。或许,在瓶颈突破之后,赶超美国公司只是时间问题。



Part.5 医疗人工智能的条件具备了吗?


前面我们说到,人工智能现在的火爆有点像当年的O2O。但如果细想这个问题,O2O可以一哄而上,人工智能也能一哄而上吗?恐怕很难,尤其是在医疗领域。人工智能的门槛显然比O2O高多了。不过,真正让很多人们对医疗人工智能望而却步的,却并不是技术问题这么简单,而是“坑”太多。


5.1 坑One:训练机器人的医疗数据从哪里来?或者更准确的说,是怎么来?


无论故事怎么讲,最庞大的医疗数据储存地必然是医疗机构。但这种涉及到患者隐私的高度敏感的问题,也必然是政策高度管制的地带。政府政策的态度就显得至关重要。


美国政府的态度还是很明确,对于医疗信息的商业化应用必须严格符合HIPAA和HITECH两个法案的规定。所以,很多医疗信息化的创业公司都会在自己的介绍中加上这么一个词儿“HIPAA-Compliant”。要想成为“HIPAA-Compliant”企业,就必须在physical和technical上符合HIPAA的要求。说白了,就是未经授权,无论是物理手段还是技术手段,都不能接触医疗信息。

HIPAA攻略,资料来源:OnLINE TECH


到中国是什么情况?2016年6月,国务院办公厅公布了《关于促进和规范健康医疗大数据应用发展的指导意见》。这份写了一年半的指导意见,也成为我国医疗大数据应用纲领性文件。


文件发布后,国家卫计委的官方媒体《健康报》组织专家做了解读并专文刊登。其中一段话特别有趣:专家表示,健康医疗大数据既不能简单说是谁的,也不能简单说不是谁的,首先要客观理性看待我们的基础。目前,我国的公民隐私保护、个人信息保护、数据保护还没有法律支持。定位它是国家重要的基础性战略资源,回避了未来要做权属分割的问题,重点放在规范和应用上,有利于行业的发展和创新。


这段话的背景是,医疗信息的归属问题一直是我国行业内热议的问题。国务院的指导意见第一句话就指出:健康医疗大数据是国家重要的基础性战略资源。如果按照“专家们”的意思,国家这个表态就是说,归属问题不要再争了,关键是好好想想怎么用。


但不管怎么用,医疗数据都存在医疗机构里面。医疗机构对医疗信息的态度就变得非常重要。然而,刚刚颁行不久《深圳经济特区医疗条例》第五十条规定了,医疗机构向患者开放全部病历。如果未来能够在更大范围推广,将极有可能改变当年医疗信息应用的格局。


5.2 坑Two:医疗问题太过复杂!


总体上来讲,医疗是个有限集合。因为基本上普通病、常见病的种类、症状以及检测的指标等,数量和范围都是比较明确的。理想状况下,可以像AlphaGo一样算清所有变化。但问题是,医疗因为是发生在人身上的事情,就让这个问题复杂了许多。


直观上讲,同种疾病会有不同症状,同种症状会对应不同疾病,在疾病的症状与结果之间没有确定的对应关系,不同疾病之间也没有清晰的边界,而且还会存在同时发病的情况。这种情况,就让很多依靠知识库建立在“if-then”逻辑上的智能问诊应用面临很大问题,起码可应用的范围就会大大缩小。


进一步分析,疾病的治疗过程是不可逆的,这就是它与AlphaGo下棋完全不是一回事;究竟是哪些因素导致的疾病,并不是所有的信息都是清楚的;正因为病因上不够清楚,以及医学本身的有限性,造成了疾病的治疗结果不稳定性。


正是因为医疗如此复杂,造成了过去五十年对这个问题的研究迟迟没有突破。而这些问题还是在第一环节诊断上,到后面的治疗环节就会遇到当前互联网医疗在商业化方面的各种问题,比如与医院、医生、药店建立怎样的商业生态。当然还有一个最重要的问题是,就算你的应用真的很牛逼,如何让你的用户用起来,以及如何获得用户都是相当艰巨的问题。


5.3 坑three:工作量巨大无比


IBM在连花了40亿美金之后,骄傲的宣布自己已经拥有1亿份患者病历,3000万份影像数据以及2亿份保险记录,数据总量超过60万TB,覆盖人数约3亿。Google抱上了NHS的大腿,获得了160万患者的健康数据。但这些,在中国每年80亿就诊人次面前,简直是沧海一粟。

资料来源:新智元


医疗人工智能的核心就是医疗数据,从这个角度出发,中国公司简直是幸福得“鼻涕冒泡”。但因为医疗数据基本都是以自然语言形态存在的,所以其实真正重要的环节是数据的结构化。这一步的工作量就将巨大无比。


但工作还远没有结束。就像不同专科的医生,拥有不同的知识结构一样,不同疾病的数据也需要不同的算法模型。这也就是为什么,我们看到的绝大多数在人工智能领域探索的医疗创业公司,包括Watson在内,都只能选择少数几个单病种。即使是机器,也没法一口就吃成胖子。


巨大的工作量起码意味着两件事情:人力和时间。对于创业公司来讲,完成前期的工作需要投入人力;而且完成每一个病种机器的训练都需要比较多的时间。这都意味着大量资金的投入。虽然我们都相信机器取代人类将是必然趋势,但这件事究竟在多久以后发生没人知道。也就是说,究竟有多少人愿意在这里面烧钱就很成问题。



Part.6 总结和讨论


6.1 一些总结


首先,由于医疗资源的短缺以及成本支出的快速增加,对医疗人工智能存在着切实的需求。但至少美国在医疗人工智能领域将近五十年的探索后,尚没有取得明显突破。所谓人工智能,大多数主要是临床辅助决策系统。而且,临床辅助决策系统究竟能够改善医疗效果,还存在争议。


IBM持续在Watson上烧钱,推动了它的明显进步,并在亚洲地区的中国、印度、东南亚等地应用推广上取得了不小的进展。但包括IBM、Google这些巨头也都仅仅是医疗人工智能的入门级水平,大量创业公司仍然存在巨大的商业机会。


但从中国的创业现状来看,智能水平普遍比较低,而且在面向机构的服务方面也比较欠缺,未来这些领域都会有比较大的成长空间。不过,在医疗人工智能领域,医疗数据的获取和结构化、医疗问题本身的巨大复杂性以及医疗人工智能在人力物力财力方面的巨大投入,都将成为这个领域的巨大挑战。


6.2 一些讨论


本文相对侧重于医疗人工智能实践路径的讨论,而对于之后的商业模式探寻不多。实际上,这两者应该是密不可分的。只有当医疗人工智能每个阶段的产品都有合适的应用时,这个领域才能够产生持续投入、持续产出的良性循环。


而从应用的角度看,究竟是从to B的角度切入,还是从to C的角度切入也有所不同。美国to B的应用比较多,而中国未来除了发展to B的应用外,能否在to C的应用上也有所突破?


另外还有一些相对比较宏观的问题,比如当下究竟是不是人工智能创业的最佳时机?虽然大家都在讨论,但这并不一定意味着时机合适。比如现在人工智能的成本是否一定低于人力成本,如果不够低,显然无法推开。比如在中国,当前医疗信息的互联互通还存在问题的情况下,医疗人工智能是否还为时太早?这些都是未来需要进一步探讨的问题。





推荐阅读

点击下方图片即可阅读


印度创投周报  |  红杉、老虎调整在印激进策略;支付领域再现过亿美元并购;华为月底在印生产手机


人物  |  Elon Musk:25年前就看准了这五件会改变人类的事情