专栏名称: CHIMA
中国医院协会信息管理专业委员
目录
相关文章推荐
51好读  ›  专栏  ›  CHIMA

医疗大模型从小事做起(五):知识库

CHIMA  · 公众号  ·  · 2025-03-25 17:12

正文

请到「今天看啥」查看全文


当前,如何把DS用好成为一个关注点,结合近期使用DS经验,个人认为,基于AI检索的知识库是一个不错的尝试。


首先简单定义一下知识库:知识库通常指的是经过组织、系统化存储的知识集合,能够被方便地检索、查询和更新。它不仅仅是数据的简单堆积,而是有结构、有分类,可能还包含元数据、索引等,方便用户高效获取信息。


前不久,我与医院科室进行了“AI检索+知识库”的内部分享。在分享时,我并没有使用上面这个略显生涩的概念去解释知识库,而是用一个相对轻松的问题,帮助大家厘清知识库的概念:书架上的一堆书,算不算知识库?或者电脑里的一个文件夹,存着跟你业务相关的教材、文档、论文,算不算知识库?


大家可以思考一下,以下是我给出的答案。



基于AI检索的知识库在医院的落地和应用,是一个不错的尝试。理由是,知识库在医院的应用自带两个优势:一是广泛的用户基础,二是良好的内部环境。


广泛的用户基础: 信息科工程师和医生两个主力群体,出于对其职业特性、工作场景和专业需求的要求,对笔记类软件使用需求高,意愿强;尽管笔记类软件并非专业知识库,但其通过结构化存储、智能检索、协同能力等设计,已经具备了轻量级知识库的特性。在使用笔记本类软件的过程中,通过功能设计和交互引导,用户也可以逐渐领会知识库的核心要义,认同知识库的理念,培养初步的使用习惯。


良好的内部环境: 这个“内”,指的是医院的办公环境大多基于封闭的内网,良好的环境是指,无论医院大小和级别,都会将文献数据库作为知识基础设施去建设实施。正是基于这样的前提,确保了医生在工作时段,被“困”于内网时,有一个相对专业、稳定的文献检索工具,一个用来对冲碎片化时间的专业学习平台。


尽管有上述两个优势,但笔记类软件和内网文献库并没有发挥其完全能力,至少与用户的期盼值有所差距。简单说就是,存进去容易,查找和整理麻烦,所以知识库的价值没有得到充分发挥,事倍功半。


以我为例,出于内容创作和学术科研需求,用了很多年笔记类软件,不仅开了会员,还搭配了微信转存,网页剪藏,甚至手表端的语音随记等功能,各种手段都上了,有空时自己还会整理和标注笔记,不可谓不用心;但尽管如此,我也只是勉强完成了“信息聚合”的上半场工作,从“信息聚合”向“知识赋能”的下半场工作,一直做得不好。


文献检索也是如此,看单篇文献容易,但是很多场景要求用户快速切入某一新领域,这时就需要从一堆文献、教材、指南中寻找看似孤立的线索,把它们拼接起来;类似于刑侦剧中,办案人员往往需要从案件卷宗、监控录像、物证档案以及证人证词中,抽丝剥茧地梳理出完整的证据链。这其中难度有多大,大家都知道。因此,知识库的“吃灰”现象,不能说是用户懒或者不用心,真的是挖掘知识价值这件事,太花时间和心思,超出了个体用户能力范围。


转机来源于DS出现后,在使用Cherry studio(一款开源的跨平台大模型桌面客户端)过程中,我惊喜的发现它自带知识库功能。当时,我正在了解某个新的学术研究方向,我一下想到了之前下载的一堆文献和教材,刚好拿来一试,可惜经过测试,当时Cherry studio 内置的 OCR 引擎对复杂布局的PDF支持不太好,但我相信这种AI搜索+知识库的理念是正确的,足以解决我之前在使用笔记类软件时,投入一腔热血去收集了一堆资料,结果价值产出只有零星半点的尴尬局面。


最终,在试用了多款不同类型的知识库,我梳理了一个合格的“AI搜索+知识库”该有的样子:


第一步是找得到:即知识库的创建。 首先通过恰当的提示词,从公开网络中提问检索,找到用户感兴趣的文献,以及相应的文献来源,并且支持一键添加到相应的知识库。


第二步是喂资料:即知识库的更新。 可以通过多种方式,将用户专属的知识添加到知识库,包括网页、公众号文章、教材、论文、任务书、截图等等)


第三步是刨根问底:即围绕知识库进行提问。 围绕用户预先构建的知识库展开提问、追问和内容解释,不仅可以提升答案的专业性和准确度,还能有效避免大模型因为公开网络数据训练引起的幻觉问题。更重要的是,一个合格的“AI检索+知识库”,要能做到将解释的结果,以及提问、追问和回答的对话记录,也加入知识库,正所谓:真理越辩越明,知识库越问越清楚。



第四步是分享和协作。 这项功能做好以后,知识库就可以从个人层面拓展到团队和科室层面,对于一个科室的业务能力传承和积累有很大帮助。有了知识库的帮助,以后科室和团队来了新人,就不用指定专人去以老带新,而是直接用知识库辅助新人快速了解该科室/团队的业务范畴、政策依据、研究内容等内容。


医院良好的信息化基础结合医疗行业知识密集型的特点,让知识库的本地化部署,不仅限于文献检索,可做的事还有很多:比如专科用药指南结合医院自研标准操作流程(SOP),搭配知识库,可以形成专属知识体系;再比如:内网文献库可作为临床决策支持系统的数据源,通过自然语言处理实现“症状-文献-诊断”智能推荐,这些都是不错的想法。


关于知识库本地部署的技术分享,可以参考 《解放军总医院DeepSeek部署实践经验分享》 这篇文章,另外,目前公网上有几家做得不错的“AI检索+知识库”,建议大家可以先体验一下:例如截图中用到的秘塔AI搜索以及腾讯的IMA知识库等等。体验的目的是为了尽可能把好用的“AI检索+知识库”理念从外网带到内网,增强内网用户体验,让内网的AI应用更好地落地生根。


相关链接:

知识库 https://docs.cherry-ai.com/knowledge-base/knowledge-base



作者简介

李楠,CHIMA委员,医院信息化工作者,医学统计学博士在读。作者观点仅代表个人,纯属技术交流,与供职单位无关。




more







微信图片_20250227111413.jpg


底部banner.jpg







请到「今天看啥」查看全文