专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
OSC开源社区  ·  Gitee AI助力医疗科研:医用耗材使用分析研究 ·  17 小时前  
程序员的那些事  ·  三个顶尖程序员,居然过得这么惨! ·  5 天前  
程序员的那些事  ·  IT巨头老板主张“每周 70 ... ·  1 周前  
51好读  ›  专栏  ›  OSC开源社区

Gitee AI助力医疗科研:医用耗材使用分析研究

OSC开源社区  · 公众号  · 程序员  · 2024-12-16 16:14

正文

本文作者:铂金小猪

我叫铂金小猪,万万没想到,我一个公立医院负责医疗耗材管理的野生程序员,有一天我会成为医疗界的「AI技术专家」(自己都觉得脸红)。上一篇文章《Gitee AI+Dify 双剑合璧,打造另类 RAG 知识库》中,我提到我们用 AI 技术参与了一个国家卫健委的科研项目。今天,我继续分享一下,我们是如何利用 AI 来参与到医用耗材管理工作里面的。

项目名称:2024医学工程研究项目

项目发起部门:国家卫健委医院管理研究所

课题名称:基于病种和临床路径的医用耗材使用管理和评价体系研究

课题单位:云南省第一人民医院、富源县人民医院

根据国家卫健委医院管理研究所的相关要求,基于病种和临床路径的医用耗材使用管理和评价体系研究项目的主要研究方向是,聚焦医院医用耗材精细化使用管理需求,研究建立基于病种和临床路径的医用耗材使用管理方法及评价体系,针对植介入重点管控医用耗材开展应用评价,优化医用耗材使用管理,服务于临床专科能力建设和医院高质量发展。

按照这一要求,我们对业务进行了分析,发现这事儿得要用 AI 的一些能力才能干完。

主要痛点分析

整个项目,基本就是围绕病历、结算数据去进行分析,根据我们的项目计划书,我们将从全省的省级、市级、县级医院共抽取一亿份相关病历来进行数据分析。如果熟悉医院信息化相关的小伙伴就会知道,这将是一个非常麻烦的事情,因为「标准不统一」,各家机构都会有个家机构的病历结构,而很多历史病历只有影印版的记录。

归纳起来,任务难点有三点:

多院区非标准数据清洗

因为是从省、市、县多家医疗机构提取病历数据,各家医院的电子病历系统的数据结构、信息化能力各有差异,而根据课题研究的要求,我们需要按照一定规则去提取相关数据,对于结构化数据我们自然可以编写相应的转化程序,但对于非标准数据,如果针对性的去开发提取程序,那将是一个非常庞大的工作量。在咨询了红薯以及 Gitee AI 的小伙伴后,我们认为 AI 的相关能力简直天生就适合来做这件事。

多模态数据识别与抽取

在医疗领域,OCR 识别一直以来都是信息厂家拿捏医院的一个法宝。但传统 OCR 技术的识别率是低的感人的。我们需要一个能读懂病历照片,并根据我们的一些指令提取相关信息的程序,随着Qwen2-VL-72B等优秀多模态大模型的开源,这一需要将不再是难题。

多因子影响的耗材使用合理性分析

哪怕不是医疗从业人员,也能想到一个事情,一个患者的耗材使用情况,除了取决于手术方式,还取决于患者的具体病症、基本生命体征等。这些影响因子之间还会有交叉影响,我们可以对真实世界的耗材使用情况进行描述性分析,但针对具体的每一个单例的耗材使用情况,还需要进行更为深层的多元分析。这样的事情,很显然最适合交给 AI 来做。

技术实现路径

专业知识库建设

做为一个野生程序员,我自然也是知道 LLM 是存在幻觉的,这样的幻觉在我们这个案例里面,显然是不行的。RAG 技术是消除幻觉的一大法宝,而恰好医疗行业是一个最不缺少各种知识内容的行业,所以我们需要为 LLM 准备一个诊疗专家知识库和一个耗材专业知识库,前者对具体的诊疗技术做描述,后者则是医用耗材的使用说明书。

知识图谱

我们已经整合医院信息系统(HIS)、电子病历(EMR)等内部数据,结合医学文献、临床指南等外部资源,进行数据清洗和预处理。随后,基于医学本体(如SNOMED CT、ICD-10)设计实体与关系,创建一致的词汇表,并利用自然语言处理(NLP)技术和规则驱动方法自动抽取和校正信息。

知识图谱采用图数据库(如 Neo4j)存储,建立索引以提高查询效率,并开发可视化界面方便浏览。系统集成方面,通过 API 对接现有医院信息系统,构建智能化应用如耗材推荐系统。最后,定期评估性能并根据用户反馈迭代优化,确保知识图谱的时效性和准确性。

多路数据联合推理

前文我们讲到需要进行多因子分析,那么很显然,在这个分析过程中,我们需要根据不同的病症、手术方案、检查情况、生命体征等信息进行不同路径的数据分析和推理。

提示词工程

想要 LLM 听话,你就得给他足够清楚的指令,一个 Prompt 可能包含的六个要素:任务,上下文,示例,角色,格式和语气,而且这些要素是按重要性降序排列的。提示工程涉及选择、编写和组织提示,以便获得所需的输出,主要包括以下方面:

  • Prompt 格式:确定 prompt 的结构和格式,例如,问题形式、描述形式、关键词形式等。

  • Prompt 内容:选择合适的词语、短语或问题,以确保模型理解用户的意图。

  • Prompt 上下文:考虑前文或上下文信息,以确保模型的回应与先前的对话或情境相关。

  • Prompt 编写技巧:使用清晰、简洁和明了的语言编写 prompt,以准确传达用户的需求。

  • Prompt 优化:在尝试不同 prompt 后,根据结果对 prompt 进行调整和优化,以获得更满意的回应。

总结

整个项目目前处于筹备计划阶段,更多技术的实践应用,还有待于我们去实践验证。标准用耗使用分析,是近几年的一项重点工作,随着医疗机构改革进程的推进,医保 RAG 付费的改革,医疗机构的管理能力和管理手段都亟待提升,行业里也涌现了各种各样的 AI 应用和产品,成为时下最热门的 AI 细分领域,但我有以下三点不同的看法:

AI 不是万能的,但 AI 能让一切变得更好

在医疗行业,对待 AI 需保持严谨科学态度,避免将其视为万能解决方案。尽管 AI 显著提升了效率和质量,减少了人为错误,并通过自动化日常任务让员工专注于更具创造性的事务,它也提供了精准的决策支持和个性化服务,推动了创新并增强了系统安全性。

此外,AI 优化了资源分配,促进了可持续发展。然而,我们必须谨慎应对数据隐私、伦理问题及对就业市场的影响等挑战,确保 AI 的应用真正造福社会。因此,在保持谨慎的同时大胆尝试,才能充分发挥 AI 的潜力,同时保障医疗行业的高标准和可靠性。

比起开发大模型,更重要的是让 AI 功能融入日常

近一两年,医疗 AI 领域热点新闻不断,但真正做实事的我认为不多,希望 AI 技术行业能理性和友好的对待医疗行业这些不懂技术的人吧。比起开发复杂的大模型,更重要的是将 AI 功能无缝融入日常操作中。通过简化任务流程、减少人为错误,AI 可以提升工作效率和质量,提供精准决策支持和个性化服务。关键在于使 AI 工具易于使用,确保医护人员能够直观地应用这些技术,从而改善患者护理并优化资源管理,真正实现 AI 的价值。

国产算力,安全更放心

选择 Gitee AI 做为算力服务提供平台,除了哥们儿兄弟关系,以及我这个野生程序员没得那么多资源搭建稳健可靠的算力池外,最重要的一个选择原因就是安全。

讲医疗必谈安全,而近些年数据安全形势不必多讲,近日 Gitee AI 发布了多个文章介绍了他们与各大国产算力企业的合作,这是我最安心的。

做为一个野生程序员,没有强大的团队支持,没有强大的资金支持,但对于事业的热爱之心不会因此而改变,未来我将继续努力!

Gitee AI 现已上线「有奖投稿」活动,投稿有机会获得现金奖励&周边礼品,点击下方图片了解活动详情~



↓推荐关注↓