如何看待Meta-analysis的意义?
在胡扯的结果上进行科学的综合胡扯,得到一个胡扯的结论。
——知乎@Kerouac
在某种程度上,这位知友的确一语道破真相。毕竟Meta分析已经成了撤稿的重灾区,
莫说4月20日的107篇大规模撤稿事件中Meta分析瞩目,当年BMC的43篇撤稿,也有10篇Meta出镜。这不是巧合吧?
麦子上学的时候,还觉得系统综述是个十分神圣的东西,Meta分析作为系统综述里一个定量分析方法,把各种研究结果有组织有纪律地综合起来,证据档次瞬间飙升,甩传统综述好几条街。
哪怕自己做不来,也要努力提高我的RCT的质量,让它将来能够被纳入某大神的Meta分析中,这样也算一种荣誉了。
事实证明我又Naïve了。不知道什么时候起,Meta分析成了灌水神器。真是一种挑麻婆豆腐里的肉末来吃还吃到苍蝇的感觉。
究其原因,大概是因为它既比传统综述高大上,还不用做实验,成本低,又能发个3分左右的文章,所以大家趋之若鹜。做的过程中可能略掉了某些设计环节,或者根本连纳入的原始研究都是低劣的,于是就得到了胡扯的结论。
某天跟小伙伴聊起Meta,我说我的循证老师曾经告诉我,正经做一篇系统综述/Meta分析要投入1.5万美元,4个人脱产研究,耗时
半
年,才能完成1篇。小伙伴不解,说做Meta要什么钱?不是丢给一个研究生就搞定的吗?
系统综述和Meta分析,好歹是高坐在循证医学证据等级金字塔顶层的。做出一篇优质的系统综述/Meta分析,是需要很细致而谨慎的工作。
从大的层面来说,
它比任何其他类型的文章都有更大的可能影响到指南的制定,继而大范围影响到医生和患者的切身利益,所以每个作者都应该对其怀有一点敬畏。
从小一点的层面说,咱们读到个劣质的系统综述,又误信了它,也会对自己的研究决策产生不利影响,白走许多弯路。
所以,怎样才能在乱石山坳之中,挑出一枚宝玉?
AMSTAR:系统综述的质量评价工具
幸好有一个评价工具,来鉴定系统综述的好坏,即AMSTAR量表。
一方面,它能指导系统综述/Meta分析的作者严格设计、实施分析;另一方面,它能帮助读者筛选出有价值的信息,理性采纳证据。
这个量表始于2007年,由荷兰阿姆斯特丹自由大学医学研究中心和加拿大渥太华大学的临床流行病学专家联合开发。
它由11个问题组成,每个问题有四个选项,即yes,no,can’t answer和not applicable。选yes才能得到1分,yes的数量除以11的百分数,就是这篇系统综述的质量得分。可以理解为,一篇好的系统综述应该满足这11个条件。
该量表可以在AMSTAR官网上找到,并实时计算一篇系统综述的质量评分(http://www.amstar.ca/Amstar_Checklist.php)。下面就简单解释一下这11个问题。
1. 是否提供了前期设计方案?
在开展系统综述实质工作之前,需要先发表研究方案的计划书,阐述其研究目的和意义、纳入排除标准等。当正文中引用了这份预先发表的Protocol,或伦理审查,才能选择yes。
2. 纳入研究的选择和数据提取是否具有可重复性?
至少要有2名数据提取员背对背地进行数据提取。当意见相左时,是否有合理的达成一致的方法,如小组讨论或第三方仲裁等,甚至需要与文献原作者联系,处理理解上的分歧。
最好有2人做文献筛选,2人做数据提取,加上达成一致的系统方案,或另一个人检阅其他人的工作。
3. 是否实施广泛全面的文献检索?
至少要检索2个电子数据库。报告中需注明所使用的数据库,年份,关键词或MESH主题词,如果可以的话,检索策略最好也要说明。
还要有补充检索,包括教科书,已注册而未发表的研究数据,以及追踪参考文献。至少2个数据库+1种补充检索才能选yes。
4. 发表情况是否已考虑在纳入标准中,如灰色文献?
作者需声明是否检索了各种发表类型的文献,也需说明是否因为发表类型或语言而排除了某些文献。要提到作者检索了灰色文献或未发表文献,才能选yes。
灰色文献是指会议论文,学位论文,已注册而未发表的试验数据等。如果检索的数据库本身已包含了灰色文献,也需说明。
5. 是否提供了纳入和排除的研究文献清单?
纳入和排除的都要提供。如果排除的文献没有列清单但有引用,也可以选yes。如果提供了文献的超链接,但打不开,要选no。
6. 是否描述纳入研究的特征?
最好以集合的形式,如表格,报告纳入研究的特征,包括样本量,干预方法,结局指标,还有其他特征如年龄,种族,性别,社会经济状况,疾病状态,病程,严重程度,及其他伴随的病症等。
7. 是否评价和报道纳入研究的科学性?
应提供预先设计的评价方法及出处,如治疗性研究,是否把随机、双盲、安慰剂对照、分配隐藏作为评价标准。其他类型研究的相关标准条目也需交代。每一篇纳入的文献都应列出评价结果。光有全部文献的总体评价是不算的。
8. 纳入研究的科学性是否恰当地运用在结论的推导上?
上述关于纳入研究的科学性、方法严谨性的评价,在下结论或形成推荐意见时应当明确应用。可以说“由于纳入研究的质量不高,本综述分析的结果需谨慎对待”,但不能质量差了就假装没看见。当然,如果第7选了no,这里就不可能选yes了。
9. 合成纳入研究结果的方法是否恰当?
纳入的研究是否有资格进行数据合并,也要分析检测一下,即同质性检验。方法包括卡方检验,I2等。如果存在异质性,应该选用随机效应模型,或结合其临床意义进行考虑。
如果文章中提到或描述了异质性,哪怕是说“由于这些研究异质性太高了,无法合并分析”,都可以选择yes。
10. 是否评估了发表偏倚的可能性?
关于发表偏倚的评价,最好有图形辅助说明,如漏斗图,或相应的统计分析,如Egger回归分析,Hedges-Olken等。
如果明确说到,纳入的研究不足10篇,没法做发表偏倚检验,也可以选yes。如果没有漏斗图也没有检测结果,选no。
11. 是否说明相关利益冲突?
明确交待潜在的资助来源,包括本系统综述/Meta分析的,还有纳入的原始研究的,全都要。
光看这11个问题,就知道系统综述/Meta分析绝不是一个敷衍的工作,更别说还有许多设计上、实施上的技术细节。更不应该随随便便丢给一个研究生去“独立完成”。
现在AMSTAR开发组得到了加拿大卫生研究院(CIHR)的资助,准备研发针对非随机研究(Non-randomizes Study, NRS)系统综述的评价工具,称为AMSTAR_NSR。但目前似乎未见有成果报道,拭目以待吧。
参考资料:
1.熊俊, 陈日新. 系统评价/Meta分析方法学质量的评价工具AMSTAR. 中国循证医学杂志. 2011,09. 1084-1089.
2.http://www.amstar.ca/Amstar_Checklist.php