专栏名称: 亿欧网
产业创新服务平台
目录
相关文章推荐
爱范儿  ·  iPhone 17 Air ... ·  11 小时前  
新浪科技  ·  【#腾讯发布2024全年业绩报告##腾讯第四 ... ·  12 小时前  
涵江时讯  ·  早安!涵江! ·  昨天  
51好读  ›  专栏  ›  亿欧网

国内8家公司发力,用AI破解“脏病历”难题

亿欧网  · 公众号  · 科技媒体  · 2017-07-16 20:59

正文

本文盘点了国内8家提供“病历结构化”服务的人工智能公司,从图解自然语言处理技术实现流程入手,对“脏病历”处理的产品服务体系进行大类划分,总结结构化病历助力AI+辅助诊疗产品落地的“自给自足”模式。


文/尚鞅 亿欧智库分析师


7月3日,美国《福布斯》的一篇文章引发热议,其标题为《沃森是不是一个笑话?》 ("Is IBM Watson A 'Joke'?")。 曾经在全球掀起AI巨浪的IBM Watson项目,与国际顶尖的肿瘤治疗和研究机构——MD 安德森癌症中心合作四年,累计花费约6200万美金,最终因“成果甚微”而导致合作破裂。IBM Watson项目为何难以取得突破性进展?美国癌症研究所编辑(JNCI) Charlie Schmidt 这样写道:


“该系统在‘吸收’手写的病例报告、医生笔记或者其它涉及大量文字的医疗信息上存在诸多问题。”


换句话说,Watson和MD 安德森所面对的问题,就是非结构化病历带来的困扰。所谓非结构化病历,具体指由无结构的人类自然语言构成的、无法用于统计分析的病历,我们形象地称之为“脏病历”。 目前,全球大量基于人工智能技术的辅助诊疗系统开发团队均不同程度地受到“脏病历”的掣肘,就我国病历可用性而言,现状尤其不乐观。


根据国家卫生计生委统计信息中心2016年6月底进行的全国医疗卫生机构统计数据显示,全国医疗卫生机构总数为98.9万个,其中基层医疗卫生机构92.7万个,约占总数的93.71%;而医院数量仅2.8万个,约占总数的2.86%;另有专业公共卫生机构3.1万个,其他机构0.3万个。


(点击图片可查看大图)


我国医疗行业长期发展过程中,各地方医院缺乏统一规范的临床结构化病历模型(即基于确定的结构和关系的数据表达模式和信息分类框架);基层医疗卫生机构病历写作尤其缺乏规范性,并且存在医生直接复制粘贴病历内容的现象,造成病历重复率较高,使用价值很小;此外,我国医疗机构在患者回访机制的建立方面还处于萌芽期,患者回访率极低,这也使得患者诊后延续性数据十分匮乏。我国自2002年便已出台《病历书写基本规范(试行)》,开始对病历书写提出规范化办法;2009年“新医改”政策出台后,更是将病历电子化、规范化列入国家卫生计生重点工作中,连续出台多部文件,推动电子病历规范化与医疗数据产业化进程。


(点击图片可查看大图)


然而,我国医疗机构庞大的体量,使病历规范化改革之路坎坷曲折,现有的病历根本无法满足人工智能机器学习所需的海量结构化病历数据。针对这一难题,近年来国内一些科技类公司开始将人工智能技术运用于“病历结构化”之上,并形成专门的服务产品。



一、病历结构化的技术手段:自然语言处理


病历结构化,就是将无结构的人类自然语言,通过词法分析、句法分析以及语义技术,转化为可用于查询、统计、分析的结构化病历数据。病历结构化过程,在计算机中是通过自然语言处理(Natural Language Processing,简写为“NLP”)完成的。自然语言处理,是人工智能通用算法应用的重要组成部分(人工智能通用算法应用包含计算机视觉与图像、自然语言处理两部分)。自然语言处理的算法很多,基本逻辑如下图所示:


(点击图片可查看大图)



二、两类产品服务体系 满足B端多样化需求


根据亿欧智库在“AI+医疗”领域的研究,病历结构化是AI赋能医疗行业的八大应用场景之一——“医院管理”的子场景,此外“医院管理”场景还包括基于遗传算法的医院工程建设设计、医院决策制定系统。 目前国内人工智能科技类公司之中,有8家公司正在提供病历结构化服务,其产品和服务均指向B端 ,包括医院、药企、医疗研究机构、保险公司、IT企业等。纵观这8家公司的产品服务体系,大致可以分为两类:开放性平台服务和产品应用。


(点击图片可查看大图)







请到「今天看啥」查看全文