文/张楠
导语
:
2016年,国务院出台《关于促进和规范健康医疗大数据应用发展的指导意见》,鼓励并推动医疗大数据发展,然而现状是医院信息孤岛问题仍然严峻,医疗数据远不能满足临床应用与科研需求,如何打破信息孤岛,高效充分地应用医疗数据,成为行业当务之急。
零氪科技(LinkDoc)是专注肿瘤大数据分析与应用的科技公司,通过探索医疗信息共享模式,打造医疗大数据平台,帮助医生、专家及医疗机构作出更佳决策,辅助医者,普惠患者。
零氪科技CTO罗立刚
、
联合创始人李丽平在
4月26日医疗
大数据开发及应用大会
上进行分享。
贝壳社
(iBio4P)
作为
支持
媒体全程参与大会,将嘉宾发言干货整理在此:
目前我国医疗大数据存在以下四大问题,病例量大、数据非结构化,行业无统一标准,随访困难,导致医疗数据在医疗领域的应用非常不充分,只有少量的数据被临床研究使用。
高质量医疗数据的短缺与现实旺盛的需求形成巨大反差,比如院长希望数据能够提供管理决策,专家在科研探索时希望数据提供支持和驱动,医生在给患者下诊疗意见时,也希望有数据能增强诊疗信心。所以如何解决医疗大数据的供需矛盾,满足医疗人士的渴求与需要,就成为当下医疗大数据发展的关键,也是行业共同目标。
随着全球医疗大数据研究能力的提升,
摩尔定律下计算能力的
飞速发展,数据存储能力大幅提升,
加之人工智能的发展,尤其是近两年深度学习的突破,众多企业开始进入医疗行业,(IBM Watson、Google Brain、Flatiron Health等),相信大数据在医疗领域的应用前景越来越光明。零氪科技(LinkDoc)过去两年一直专注肿瘤数据研究,在肿瘤数据这个垂直方向的挖掘和应用走在了世界前列。目前合作的三百多家三甲医院里的肿瘤相关科室,通过零氪科技(LinkDoc)的Hubble辅助决策平台产品,在辅助管理决策,辅助科研探索,辅助临床诊断方面都得到了很大的帮助。
大数据对于生活的影响,有商品大数据(京东淘宝)、社交大数据(推特脸谱)、交通大数据(滴滴出行)、医疗大数据(零氪科技等)。零氪科技(LinkDoc)是基于肿瘤的医疗大数据平台,未来有希望成为滴滴、脸谱那样的平台型企业。
医疗行业是
数据密集型行业,
医疗数据量非常大,近些年医疗数据存储量呈直线上升状态,IDC
digital
预测
截止
2020年
医疗数据
量
将达
40万
亿GB
,
所以说数据量特别大,需要算法和存储,与其他片段类数据和生活类数据不同。此外,
医疗数据加速累积,对处理、管理、共享提出更高要求
,
数据
生成
和共享速度以
10亿GB/月
的速度迅速增长。
尤其影像数据高速发展, 12排、32排、64排CT升级,单纯患者影像数据的存储就成为很大问题,所以数据量非常大是医疗大数据处理起来较为困难的重要原因之一。
我国医疗大数据主要由三大部分构成:(1)公共卫生数据,(2)医院临床数据,(3)移动医疗
健康数据
。各
数据端口呈现出多样化且快速增长的发展趋势。
其中,电子病历数据最多,这块可以做什么?电子病历为核心的临床信息系统中蕴藏了疾病诊疗的大数据。医院信息科分得非常详细,这些系统相对来说比较分散,处理困难,融合也很困难。如果把这些数据搜集起来,就很有帮助。
电子病历的五大特征:
全
集成
——从医疗护理化验、各种检查和手术麻醉,从门诊病历、住院病历、查体病历来看,我们认为医疗数据可以做到全集成的;
全过程
——从患者入院到出院,医嘱下达、药房调剂、护士处理、床旁执行等,在医院的任何治疗和护理影像都会从头到尾全程记录下来;
全周期
——包括门诊查体和住院历史记录,其中管理比较好的是患者的住院病历数据,非常规范,能把一个患者历次住院的信息串联起来。
智能化——
合理用药、临床指南、临床路径和临床决策方面也有很多创新企业。开发APP等工具帮助医生做决策。
多态性
——对于纯数据(化验单),信号图(心电图/脑电图),图像(B超、CT),文字(主诉、病史、医嘱)不同形态的数据怎么融合是比较大的挑战,也是应该解决的问题。
可以看到,就个体而言,
生物医学大数据很复杂。
将多维度的临床数据拆分为家族病史,体检数据、影像数据,诊疗数据,用药预后等等
,
最近比较火的是组学数据,组学数据又分得比较细,包括
基因组数据、转录组数据、表观组数据、蛋白组数据、代谢组数据和微生物组
数据
等。
(1)信息孤岛的现象比较严重。
从院内的各个系统到跨医院、跨全国数据的互联互通都困难,业务系统相互独立,数据分散在不同业务系统中,不能在同一视图中了解同一患者各科的临床数据,数据再利用较难。
(2)缺乏规范化、标准化和信息互通制度的建设
。造成虽然在临床过程当中有大量的数据,但是在进行结构化转变过程中,很多数据是没有办法成功转化的,从而造成数据缺失。这是从源头上数据管理存在的一些问题,我们要加强对源头数据管理和质量提升。其次是缺乏数据语义模型标准,到底使用哪个数据作为标准化的模型,需要进行统一。最后是缺乏异常数据实时监控治疗报告。
(3)信息需要二次加工、利用。
数据孤立、患者信息不能自动关联整合,采集难度大,无法挖掘结构化电子病历数据,分析力度和能见度有限,无法多维度的分析。
现在医疗大数据应用突破的核心问题:
(1)规范
采集与
标准化。
(2)医疗
大数据
的智能导航和智能干涉。
智能导航是当出现问题时,比如病历书写过程中,录入数据的时候,会有一些逻辑冲突,不能录入。智能化的控制对提高病历书写准确率有一定帮助。
(3)信息安全和隐私保护。
国家最近也颁布了新电子病历的管理办法(最新电子病历应用管理规范(试行)),对个人隐私定义进行了标准描述,对实现信息共享做了更多的定义和规范,这是互联共享方面。
在分析挖掘方面:
(1)疾病做早期诊断与预警。
人工智能做出辅助决策,有望提供真正帮助。
(2)辅助诊疗与智慧医疗。
包括可穿戴设备如何跟临床指标相结合,最终形成智慧医疗。
(3)精准医学与个体化治疗。
这也是“十三五”重点推进的项目。
因此,我们需要搭建医疗信息服务共享平台,实现以下功能:
(1)标准规范:
实现数据的互联互通和标准规范,打破医院间的信息屏障。
(2)分析挖掘:
发展人工智能和深度学习,推动基于大数据转化应用技术,从健康医疗大数据中发现新知识和新规律。
(3)医疗建模:
建立系列医疗模型,促进“智慧医疗”和“分级诊疗”等实施。
(4)项目对接:
与国家重大研究计划对接,促进医学科学发展和全民健康水平。
(5)人才培养:
我们与国家重大研究计划对接,促进医学科学发展和全面健康水平,培养大数据人才。
我们探索了很多医疗信息共享模式:
1、区域共享
模式
:区域医疗机构协同合作的数据共享和交换平台,如地市级肿瘤医院联盟;
2、单病种
共享模式:
单病种数据协作平台:用注册临床标准,对录入/随访工作进行质量控制,形成“采集-整合-结构化-随访”的完整闭环数据;
3、企业共享模式
:
建设医疗企业健康数据共享云平台,推动企业多样化的健康数据整合、共享与高效利用。
4、个人共享模式:
将个人健康数据共享给有资质的组织或企业,形成大规模人群健康数据和疾病数据库。
5、医联体
共享模式:
基于医联体实现优质医疗资源共享平台和同质化的检验、检查结果互认。
第一,
我们做
了病历结构化