医疗健康产业属于海南十二大重点产业之一,同时国家赋予博鳌乐城国际医疗旅游先行区“特许医疗”政策,为海南进一步提升医疗、医保、医药服务水平,形成优势产业注入了新的动力。2024年“数据要素x”大赛海南分赛医疗健康赛道自开赛以来,共吸引70余家参赛团队积极参与,
最终,由海南省卫生健康委员会统计信息中心领衔,海南医科大学第一附属医院、华东理工大学共同参研的参赛项目——《基于大模型的三医联动监管项目》,荣获医疗健康赛道一等奖并在全国总决赛中获得医疗健康赛道三等奖。
本期将对《基于大模型的三医联动监管项目》进行案例分享。
近年来,
海南省通过“三医联动一张网”项目建设,成功建立了全国首个省级信息化体系。
然而,医疗质控、医保控费和药品不良反应监管等方面仍需进一步整合与优化。目前,大模型技术的迅猛发展给各行各业带来了新的技术机遇,而现有医学大模型训练大多依赖文献数据,忽视了电子病历这一重要数据源。
《基于大模型的三医联动监管项目》首先通过采集电子病历及其他相关数据,进行指标标注,形成可用于训练和测试的数据集。
接着,项目采集了卫健委和三医平台的数据,结合医学书籍等知识型数据,并通过OCR等技术构造了大规模的二次预训练和指令数据集。在已有的开源基座模型上,进行二次预训练和指令微调,并利用训练好的大模型构建智能体(Agent)框架,实现了文本到规则(Text2Rule)的自动化计算。
该项目通过构建智能体框架,并结合知识库和检索增强技术,显著提升了对电子病历理解能力与指标计算的精度,有效弥补了海南三医联动平台在语义级指标计算方面的不足。
一是在业务创新方面,
基于电子病历,可溯源到原始文本,结合临床信息直接进行计算,避免了因统计过程不完整所导致的误差,从而节约了医院填报和计算的成本。此外,本项目引入复杂指标,全面反映病情,以避免一刀切的处理方式。
二是在技术创新方面,
大模型能整合多种知识,更加准确地理解病历内容。本项目创新性地提出了利用思维链与反思技术的Text2Rule引擎,将质控需求细化为可执行的规则和代码,同时利用反思技术消除大模型的幻觉,确保结果的准确性,减少了人工编写质控代码的成本。在电子病历语义规范上,结合了json和自然语言,简洁精准,便于数据转换。
基于三医数据的智能医保控费、医疗服务质量监管、药品监督管理