专栏名称: 中国数字医学
传播数字医学发展动态,发布医疗卫生信息化相关信息
目录
相关文章推荐
第十一诊室  ·  一穿四季的德训鞋,究竟为啥那么流行? ·  2 天前  
转化医学网  ·  【Nature子刊】硫辛酸-硼苯丙氨酸囊泡: ... ·  3 天前  
drpei  ·  春节效应?南方省份流感再现高峰 ·  2 天前  
新青年麻醉论坛  ·  战友经验 | 相信新青年,YYDS! ·  5 天前  
肿瘤资讯  ·  2025 ASCO GI | ... ·  6 天前  
51好读  ›  专栏  ›  中国数字医学

医院科研大数据平台的应用实践探索

中国数字医学  · 公众号  · 医学  · 2022-01-28 16:40

正文

点击蓝字

关注我们


利用大数据平台在科研一体化构建等方面的科学性与时效性,探讨其在单病种研究的使用价值。利用医院科研大数据平台高效的数据采集与清洗、数据治理与标准化、后结构化处理、大数据搜索能力、科研统计分析能力等科研手段,优化科研工作模式,提高科研效率与分析能力。针对科研要求,设计电子CRF表单,通过宣教、电话、微信、医院信息管理系统、电子病历系统等实时获取患者康复情况,专项建立患者康复随访数据库,实时更新数据库数据。科研大数据平台能够有效地提高科研工作效率,对单病种研究有积极的促进作用,并能够加快科研进程与科研结果产出。


引言

近年来,大数据、人工智能等计算机技术迅猛发展,对临床医学科研模式的影响正日益提升。十三届全国人大常委会第十五次会议通过的《基本医疗卫生与健康促进法》已于2020年6月1日开始施行,明确提出“国家加强医学基础科学研究,鼓励医学科学技术创新,支持临床医学发展,促进医学科技成果的转化和应用,推进医疗卫生与信息技术融合发展,推广医疗卫生适宜技术,提高医疗卫生服务质量”。传统科研模式下科研工作效率不高,为更好地收集和研究病例资料,方便临床科学研究,需利用新的技术手段予以解决。


医院信息化建设经过多年的完善,已形成全院级的数据中心、数据仓库及知识库,为临床科研提供了高质量数据服务支撑。患者治疗效果信息大多必须借助随访,建立随访系统作为临床数据中心的补充,并将其结构化后抽取到科研数据中心(Research Data Reposi tory,RDR),提高科研数据的完整度和准确性。此外,科研平台还对提取数据进行标签处理,根据其科室特点建立单病种库并按研究方向进行分组,以满足多维度教学需求。在科研数据中心基础上,建立科研大数据搜索引擎和临床科研软件,通过对大样本临床数据的回顾性分析,利用真实的患者临床数据分析病种、治疗及相关数据的关联性,为临床科研人员建立疾病预测模型,以提高医疗水平和保障治疗效果。


科研大数据平台构建方法与特点

大数据平台构建方法 严格遵循国家《电子病历基本数据集》《国家卫生信息标准基础框架》《卫生信息数据元目录》等数据平台建设标准与规范,将临床活动生产的所有数据通过ETL技术进行抽取、转换、清洗并转存到标准化的大数据平台的数据模型中,形成按领域组织、方便使用的临床数据集。


大数据平台立足于临床数据管理,包括数据存储、数据交互、数据安全、数据分析、数据容灾、数据容量扩展等为一体的数据中心管理系统,系统采用分布式数据存储和独有的数据加密技术,对临床数据中心进行全方位的管理。包括患者信息、医嘱、检查、检验、病理、手术、病案、病历、临床路径等,涉及数千个数据字段的采集、清洗、转码载入工作,涵盖HIS、LIS、RIS、CPOE、EMR和移动护理等各类业务系统,异构数据库涵盖SYBASE、SQLServer、Oracle,MySQL,数据时间范围包括信息化以来的历年数据及实时数据等。采用PDF、XML、关系型数据等数据存储技术,为临床数据分析、数据挖掘、智能医疗打下坚实基础。


在大数据中心的基础架构上构建研究型科研数据库,数据涵盖科教各领域的数据,实施服务包括数据领域有基线数据、随访数据、研究对象、研究人员、课题数据、教学数据、样本数据等,并以此数据库来支撑多中心研究工作的开展。同时,建立并完善患者主索引(EMPI)、患者360等平台服务,加强医疗协同服务,落实临床决策支持,保证临床数据完整性及满足临床科研需求,重点完善或替换电子病历、医嘱等系统,实现松耦合闭环流程。科研大数据平台构建见图1。

图1 科研大数据平台构建


数据治理与标准化进程 大数据平台的数据来源于医院HIS、EMR、LIS、RIS、人事系统、治疗系统、随访系统等临床系统。真正使用这些数据,首先要进行数据治理与标准化,而数据标准化及归一化处理需要遵循国际与国内相关标准,其中涵盖SNOMED CT、LOINC、ATC、ICD10诊断编码、DRG分组规范,以及各类国标、标行的数据字典等内容。通过发布订阅、CDC、OGG等技术,遵循相关标准,使用作业管理、日志管理等平台,按照数据领域将采集到的原始数据放到数据模型中,实现数据的“可用化”加工,并通过数据制备策略,为不同的应用场景制备数据,实现数据“拿来即用”。形成涵盖临床数据、标本数据、管理数据、科研数据的海量数据资源。通过数据脱敏、数据加密等,在数据应用前对数据进行“安全化”处理,并通过访问控制平台,以数据账户为依据,给不同的用户、不同场景的数据访问权限。同时,在数据被使用过程中,有数据审计、使用留痕等一系列保障措施,让管理人员知道数据在什么时间、什么场景、被什么人使用。科学的数据治理的核心能力包括理解数据、解释和评估数据、管理数据以及使用数据。


临床科研自动化表单(eCRF)的建立 构建基于科研大数据中心的临床科研系统,将科研数据自动采集、临床试验观察表(CRF)智能化构建、智能化数据关联以及高效的随访模式结合,形成“流水线式”采集平台,帮助科研工作者快速便捷地完成大量重复工作,使医院科研管理进一步智能化。


其构建过程具有如下特点:①病种构建模式灵活:可以根据入组规则自动入组构建单病种数据库,也支持跨病种的大型队列研究。②科研模型可配置化:研究方向、研究项目、随访计划、eCRF表单自定义配置与表单自动填写。③数据衔接自动化:临床元数据自动对接eCRF表单,数据按入组规则自动校验。④数据处理智能化:科研病种库表单可以自动与数据中心数据关联,科研病种库表单可以自动与解析好的病历数据关联加载到表单中。见图2和图3。

图2  eCRF表单定制

图3 eCRF表单自动填写


基于大数据中心的搜索引擎工具 在科研大数据应用过程中可以使用科研搜索引擎来提高科研工作效率。传统的关系型数据库复杂的检索不仅要求对存储数据结构熟悉,而且检索可能消耗几个甚至几十小时的时间成本。基于大数据的搜索系统通过大数据搜索引擎技术,可以与科研人员快速交互相应,及时调整搜索结果,将原来需要几个月的数据搜索、挑选、整理工作缩短至几小时完成。并且提供跨异构的大数据多条件复杂搜索、模糊搜索、精确搜索、同义语、逻辑运算表达式及搜索结果2次筛查及授权导出等内容。大数据搜索工具极大地降低了科研人员在数据检索与提取方面的工作量,并且提高了科研工作整体效率。科研大数据搜索系统架构见图4。

图4 科研大数据搜索系统架构


应用成效

2019年至今,科研平台已搭建3个病种库,总处理住院患者数据167 448例,病种累计样本量入库6 000余例,并且每年以800例以上数据持续增长,采用eCRF对患者数据采集,包括患者基础数据、病历文书、检验检查数据,术前、术中、术后病历数据和术后随访数据等500多个字段,共采集10 544条体格检查信息,10 543条影像信息,6 515条手术记录,873 447条化验记录,25 957条化疗信息等海量数据记录,利用这些宝贵的临床数据,使用数据挖掘工具,对数据进行治理,包括数据归并、补充、标准统一、打标签、后结构化处理。利用大数据工具对采集到的数据进行分析,十分有效地帮助科研挖掘疾病规律,得出更有效的治疗方法。从单病种看,对结直肠癌病种科研数据采集情况进行分析,分为单孔腹腔镜研究、RCT研究、肠癌综合治疗、经阴道自然腔道内镜手术(V-notes) 研究、结直肠癌5个方向研究,2020年6—12月病例收集总体呈上升趋势,见图5。


图5 2020年研究方向病种入组病例


讨论与展望

对于医疗科研单位来说,随着临床业务信息化的发展所产生的海量的医疗数据散落在各自系统中。其中患者诊断、治疗方案、治疗进程、康复情况、手术记录、医学影像、实验室报告等数据的时间跨度大、数量庞大、存储分散、增长快,对于这些数据临床个体患者查询、存储、追溯等由于业务系统不断升级,各厂商未有统一存储标准,因此,导致查询慢、追溯病案信息过程复杂,难以将这些数据应用于科研分析和支持临床决策。







请到「今天看啥」查看全文