文献来源:
吕晗
,
王悍
,
刘军
,
刘辉
,
罗旭飞
,
周奇
,
陈耀龙
,
王振常
,STAR
影像医学专科委员会
.
提升指南及共识质量,促进影像医学高质量发展
[J].
放射学实践
,2025,30(2):137-140.
【摘
要】
正确理解、制订和评价
临床实践指南(以下简称“指南”)
及
专家
共识
(以下简称“共识”)
是现代医学高质量发展的关键。近年来,我国影像医学领域指南
及
共识的制订数量逐年快速增长,为影像医学领域的高质量发展贡献了巨大力量。鉴于
高质量的指南及共识有助于指导和规范临床诊疗行为、提高患者收益,行业需在关注数量的同时,更关注其
质量。
积极推进指南及共识的质量评价与提升,将更有力地推进影像学科的高质量发展。
【关键词】
临床指南;专家共识;影像医学;质量控制和改进
临床实践指南(以下简称“指南”)及专家共识(以下简称“共识”)是临床诊疗决策的重要参考
[1]
。
2018-2022
年,中国医学领域发表的指南数量为
1000
余篇、共识为
3000
余篇。随着人工智能、自然语言处理、影像组学等新技术的迅速发展,影像医学领域制订的指南和共识也呈现逐年增长的趋势。据统计,
2021
年和
2022
年我国影像医学领域发表的指南及共识的数量分别为
39
篇
[2]
和
65
篇
[2]
,涉及了临床诊疗相关的诸多方面。
2023
年和
2024
年预计每年亦将超过
60
篇。指南及共识数量的快速提升是影像医学领域蓬勃发展的缩影,充分体现了影像医学作为平台学科支撑临床医学高质量发展的行业地位。
然而,随着制订数量的快速增长,指南及共识的质量则在近年来受到更多关注。研究表明,制订不规范、报告不完整和有严重利益冲突的指南及共识不仅临床价值低,甚至有可能误导临床决策、造成医疗资源的浪费
[4]
。质量低下、甚至是未经过严格质量评价的指南及共识,不应作为参考依据而直接应用于临床实践
[1,5]
。因此,制订者、使用者、同行评审专家、期刊编辑以及指南研究者均需要充分重视指南及共识的质量,从而推动高质量指南及共识的制订、传播和应用。
为了有效开展质量评价,首先需要明确评价对象。指南、共识、标准、规范、专家建议、专家意见等都是临床诊疗常见的参考性文件类型,都可以作为指导临床实践的重要文件。但上述几类文件的定义与内涵各不相同,也各有适用范围及条件。
具体而言,根据美国医学科学院定义,指南是指“基于系统评价的证据和平衡了不同干预措施的利弊,形成的能够为患者提供最佳保健服务的推荐意见”
[6]
。在医学领域,共识则缺乏统一的定义。借助国际标准化组织(
International Organization for Standardization
,
ISO
)这一更广泛的组织对共识的定义,我们可认为共识是
“
有关重要利益相关方对实质性问题没有坚持反对意见,同时按照程序考虑了各方观点并协调了所有争议的结果
”
[7]
。标准是指
“
通过共识的方法制定并经权威机构批准的文件,为各种活动或结果提供可被共同使用和重复使用的规则、指导或属性
”
,具有相应的管理部门和管理办法。规范是指
“
指规定产品、过程或服务应满足的技术要求文件
”
。专家意见和专家建议通常所包含的主要内容符合指南或共识的定义,部分期刊也将其归类为指南与共识相关栏目
[8]
。综上,考虑到标准已有相关的管理部门和管理办法,指南、共识、规范、专家建议以及专家意见这五种类型尚未进行统一管理,因此,本文主要涉及上述五种类型文章的质量评价。
鉴于高质量的指南及共识有助于指导和规范临床诊疗行为、提高患者收益
[9]
,行业需在关注数量的同时,更关注其质量。
目前国内常用的指南及共识质量评价工具包括以下几种:指南研究与评价工具(
appraisal of guidelines for research and evaluation II
,
AGREE II
)
[10]
、卫生保健实践指南的报告条目(
reporting items for practice guidelines in healthcare
,
RIGHT
)
[11,12]
、指南科学性、透明性和适用性的评级工具(
scientific
,
transparent and applicable rankings
tool for clinical practice guidelines
,
STAR
)
[13]
等,各工具的研发机构、评价维度、评价方式及其特点见表
1
。国际上还有诸多质量评价的方法
[14,15]
,在此不做赘述。需要关注的是,以上方法大多基于指南进行针对性研发、使用。由于目前尚无公认的共识评价方法,因而共识仍按照指南的评价方法进行质量评价。
基于上述方法,已有多位学者评价了我国指南及共识的质量。例如,
Zhou
等
[16]
基于
AGREE II
评价
2014-2018
年我国发表的
573
篇指南的方法学质量,平均得分为
19.4%
;基于
RIGHT
评价上述指南的报告质量,平均报告率为
30.4%
。刘云兰等
[17]
基于
AGREE II
评价
2019
年我国发表的
226
篇指南的方法学质量,平均得分为
25.3%
;基于
RIGHT
评价上述指南的报告质量,平均报告率为
33.9%
。从数据变化趋势来看,我国指南的方法学质量及报告质量在不断提升,但提升空间仍然很大。聚焦在专业领域,孙婧等
[18]
分析了
2017
年
1
月
-2022
年
2
月我国发表的
18
篇影像医学领域指南,平均报告率为
56.2%
,高于医学领域的平均报告率。
由于
STAR
工具的评价维度更全面,评价条目更丰富,有效完善了指南的评价体系,同时因其兼具良好的信度、效度,易用性强、可提升评级人员的效率,还可用于指南及共识的综合评价和分级
[13]
,因此,
STAR
工具已经成为
目前国内应用最广的指南及共识质量评价工具。
为了克服现有临床实践指南评价工具的条目覆盖面不足、验证不充分、维度单一和评价工作量大等问题、进一步提升我国指南及共识的质量,由世界卫生组织(
World Health Organization
,
WHO
)指南实施与知识转化合作中心、中华医学会杂志社牵头,于
2022
年发布了
“
临床实践指南
科学性、透明性和适用性的评级
工具
”
,即
STAR
[13]
。
STAR
工具的研发由指南方法学、临床医学、流行病学、统计学、期刊编辑等组成的多学科的专家工作组实施,包括了来自
15
个省级行政区(省或直辖市)、
34
个专业的
79
位专家。通过概况性评价、德尔菲调查、层次分析法、共识会议、信度、效度和易用性测试五大步骤,最终形成
11
个领域
39
个条目和相应分值的综合性评价工具
[13]
。该方法主要的使用人群为指南的评价和评级人员,指南制订者、实施者和研究者也可利用该工具协助完成各自的工作。
随着
STAR
工具的推广,中华医学会杂志社指南与标准研究中心、中国医学科学院循证评价与指南研究创新单元、世界卫生组织指南实施与知识转化合作中心发布了《
2021
年医学期刊发表中国指南和共识的科学性、透明性和适用性的评级》
[2]
,共纳入
291
篇指南和
858
篇共识,指南平均得分为
31.9
分(满分
100
分),中位值为
25.9
分;共识平均得分为
22.7
分,中位值为
19.6
分。
2022
年以同样方法评价我国指南和共识
[5]
,共纳入
334
篇指南和
1143
篇共识,数量呈上升趋势,指南平均得分为
43.4
分,中位值为
39.0
分;共识平均得分为
28.3
分,中位值为
25.1
分,较上一年度有一定提升。
为了持续推动
STAR
的普及应用,由中华医学会杂志社指南与标准研究中心联合
WHO
指南实施与知识转化合作中心进一步牵头成立了
STAR
工作组(图
1
),包括了执行委员会、咨询委员会、秘书处等核心机构,并成立了国际专家委员会、包括影像医学专科委员会在内的