专栏名称: Med重症
分享国内外最新的呼吸与血液净化研究进展、会议资讯、临床知识、病例讨论以及相关文献指南。
目录
相关文章推荐
德州日报  ·  退!钱!啦! ·  昨天  
数据宝  ·  DeepSeek带飞AI,4只核心潜力股获机 ... ·  2 天前  
华尔街见闻  ·  华为何以重回巅峰? ·  3 天前  
经济参考报  ·  夜读|这三种相处模式,让家越来越兴旺 ·  3 天前  
51好读  ›  专栏  ›  Med重症

重症RCT研究的过去、现在和未来

Med重症  · 公众号  ·  · 2022-11-16 00:00

正文

重症RCT研究的过去、现在和未来

Granholm A, Alhazzani W, Derde LPG, et al.Randomised clinical trials in critical care: past, present and future. Intensive Care Med. 2022 Feb;48(2):164-178. doi: 10.1007/s00134-021-06587-9.Epub 2021 Dec 2. PMID: 34853905; PMCID: PMC8636283.

1. 背景

RCT研究改变了医学实践,随机化是干预效果的金标准。临床试验从2500年前巴比伦比较饮食方案开始,到1747年坏血病的研究,再到20世纪40年代青霉素治疗普通感染的第一项RCT研究,确立了现代临床研究的伦理标准( 1 )。尽管RCT的基本概念相对没有改变,协作的程度已经增加,样本量变得更大。此外,小样本的RCT研究与更实用的RCT 研究 就互补,更贴近临床实践。 同样,按照研究计划进行的分析与意向治疗分析互补,无论研究的依从性如何,评价实际情况下的效果。 这样可以更好地推测在临床实践中一种方法是否优于另一种方法。


2. 重症监护中 RCT 的常见缺陷和挑战

RCT不是没有缺陷,有一些是设计的问题,有一些是实施的问题。第一,大多数RCT比较两种干预措施,但是可能会导致治疗措施过于简单化。第二,大多数RCT的样本量推算采用最佳的效应,但是对于某些差异小的但是临床重要的效应不能验证。结果从临床角度来说,很多重症的RCT研究结论不一致。第三,重症研究常常关注病死率,但是传递出的信息少,需要大样本。干预措施可以降低一种原因导致的并发症或病死率,但是不能评估其他原因导致的死亡风险。第四,传统RCT不灵活。尽管实施中期分期,常常依赖严格的标准停止研究。但是无论有害还是有益,一般只在效果差异非常大时才能发现。第五,计划和实施RCT费时费钱,缺乏研究之间的协同。最后,即使RCT有结论,推广和实施这些结论进入临床实践需要相当的时间的精力。

3. 大样本研究、标准化、 meta 分析和研究计划

对于统计效力差、结论不一致RCT的简单解决方案是入选更多的患者。数量少,但是样本量大的RCT会产生重要的证据,优于多个小样本研究。因此,聚焦广泛应用的措施,如Mega-ROX RCT研究通过40000例ICU患者比较氧合目标,对于差异小的效果提供了肯定的证据,而这个效果是既往RCT研究证实或反对的。

对于非常大样本RCT的替代方法是对于RCT的标准化,然后进行meta分析。这样的例子包括三项EGDT的大样本RCT的meta分析,全身应用糖皮质激素和IL-6拮抗药对于COVID-19效果的meta分析,以及清醒俯卧位治疗合并缺氧COVID-19的六项RCT研究的meta分析等。RCT研究的设计应该作为设计的一部分( 2 )。当RCT结束后,结果应该进行meta分析的更新,纳入临床指南,方便实施。例如,SUP-ICU研究总结了证据,进行了RCT。研究完成后,结果进入了meta分析,进入了临床指南(RCT研究。Krag M, Marker S, Perner A et al (2018) Pantoprazole in patients at risk for gastrointestinal bleeding in the ICU. N Engl J Med 379:2199-2208。Meta分析。Barbateskovic M, Marker S, Granholm A et al (2019) Stress ulcer prophylaxis with proton pump inhibitors or histamin-2 receptor antagonists in adult intensive care patients: a systematic review with meta-analysis and trial sequential analysis. Intensive Care Med 45:143-158。临床指南。Ye Z, Blaser AR, Lytvyn L et al (2020) Gastrointestinal bleeding prophylaxis for critically ill patients: a clinical practice guideline. BMJ368:16722)。


4. 预后选择

历史上,大多数重症患者RCT主要聚焦全因病死率。但是病死率仅包含两个值,生存或死亡,但是没有健康状态。因此病死率不敏感,不如幸存者的其他临床指标改善,如疾病缓解或功能改善。因此病死率的研究需要大样本。在COVID-19流行期间,RCT聚焦预后信息如病死率和无呼吸机时间。采用复合终点可以增加统计效力,但是各个终点的权重不同,可能出现插管率增加而病死率下降等情况。最后,核心预后指标的设定有助于优先化和标准化预后指标的选择,可以用于比较RCT的结果。

5. 避免二分法,接受不确定

大多数RCT采用频数统计,结果二分为有意义和无意义。P值是假定无效假设是正确的,是一种间接的可能性( 3 )。P值依赖于统计效力和样本量。无论临床意义如何,样本量大时P值小,样本量小时P值大,因此需要推测统计效力的大小。EOLIA研究结论是,重度ARDS应用ECMO治疗后60d病死率不显著低于传统呼吸机氧疗。尽管技术上正确,可能过度还原论,因此结论是基于60d病死率,ECMO组35%,传统组46%,P值=0.09,而样本量计算是基于绝对值下降20%。同样,ANDROMEDA-SHOCK研究结论是,基于毛细血管再灌注时间的复苏策略和以血乳酸为目标的策略复苏,不降低28d全因病死率。研究是基于28d病死率分别为34.9%和43.4%,P值为0.06,样本量计算是基于病死率绝对值降低15%。


目前越来越多采用Bayesian统计方法代替传统的分析方法,采用概率分布表达先验理念。资料收集后,更新为后验概率分布。先验的选择很困难,可能滥用来得到想要的结果。如果先验概率明确地事先确定,评估是否合理就很容易。后验概率分布可以采用多个方式总结。可信区间直接代表最可能的值,可以计算各种统计效力的直接可能性,临床上很重要或实际上的对等( 3 )。在对EOLIA和ANDROMEDA-SHOCK研究的Bayesian再分析后,采用最小信息或中性先验方法,干预组的受益可能性分别为96%和98%(Goligher EC, Tomlinson G, Hajage D et al (2018) Extracorporeal membrane oxygenation for severe acute respiratory distress syndrome and posterior probability of mortality benefit in a Post Hoc Bayesian analysis of a randomized clinicaltrial. JAMA 320:2251–2259.和Zampieri FG, Damiani LP, Bakker J et al (2020) Effect of a resuscitation strategy targeting peripheral perfusion status vs serum lactate levels on 28-day mortality among patients with septic shock: a Bayesian reanalysis of the ANDROMEDA-SHOCK trial. Am J Respir Crit Care Med 201:423–429)。尽管采用干预的阈值根据资源/可利用的选择和费用等有差异,采用多个先验概率,再分析可以导致更多细致的描述。采用传统的频数避免二分类也是可能的,但是对于很多临床医师、研究者来说,统计学意义如此根深蒂固,而细微的描述可能更容易操作。

根据干预措施,可以采取不同的证据阈值。如果比较常用的熟知的干预措施,而费用相似,可能仅需要较少的确定证据。如果实施新的、花费多的干预措施,那么需要更明确的证据。这与临床指南对于证据的考虑相似,需要比较费用、实施的负担和患者的选择。尽管需要避免因为没有统计学差异定义为没有差异,需要事先设定的阈值来批准新的干预措施来宣布研究成功。因此,尽管需要考虑患者的特征和选择,需要对于细微证据总结的标准化策略,以保证标准化的描述和实施。

6. 治疗效果的典型性和异质性

RCT结果一般代表典型的治疗效果,但是在亚组人群中可能存在异质性。一个中性的典型效果对于某些患者有益,而对另一些患者有害( 4 )。有益的典型效果在亚组中可能有差异,因此可能会影响应用干预措施的决策。尽管大样本实用性RCT可以发现临床的典型治疗效果,指导临床实践,但是因为其纳入异质性人群的问题受到质疑,比如ICU内的脓毒症或ARDS。很多RCT通过传统的亚组分析评估治疗异质性(Girbes ARJ, De GH (2020) Time to stop randomized and large pragmatic trials for intensive care medicine syndromes: the case of sepsis and acute respiratory distress syndrome. J Thorac Dis 12(Suppl 1):S101–S109)。如果评估亚组分析的主要预后结果,需要更多的患者。因此很多亚组分析因为统计效力不足,可能没有显示临床意义。评估治疗异质性的的替代措施包括预测性治疗异质性分析,采用聚类算法和临床只是确定亚组和不同的临床表现型,采用连续变量而不是分类变量评估相互作用,采用Bayesian等级模型,以及适应性富集(adaptive enrichment)。粒度分析可能更接近个体化医学,但是需要等大样本的数据。无论采用哪种方法,在描述亚组的治疗异质性分析时都要注意。

7. 适应性

适应性研究尽管设计有相似的错误率,较传统RCT更有效率。适应性研究大多数时候采用Bayesian分析方法,适用于证据的连续评价。适应性研究的适应性表现在多个方面。首先,预先设定的决策规则允许研究不需要事先设定样本量,因此允许研究一直运行至累积足够的样本量。一般推测样本量采用模拟法,如果预计的基础风险和效果不正确,最后的样本量与预计不同,而适应性研究仍然可以获取足够的样本量。而且,适应性样本量更适合新的疾病,不需要样本量计算。如评估高频通气治疗ARDS的OSCAR研究,如果采用Bayesian适应性设计,可以降低患者病死率>15%,减少入组患者(Ryan EG, Bruce J, Metcalfe AJ et al (2019)Using Bayesian adaptive designs to improve phase III trials: a respiratory care example. BMC Med Res Methodol 19:99)。第二,可以适应性评估研究,可以同时或连续评估多个干预措施或剂量,可以去掉最没有希望的,直到得到肯定性的证据。这用于寻找剂量的研究,如SEPSIS-ACT研究比较三种剂量的selepressin和安慰剂,然后进一步进行比较(Laterre PF, Berry SM, Blemings A et al (2019) Effect of selepressin vs placeboon ventilator- and vasopressor-free days in patients with septic shock: the SEPSIS-ACT randomized clinical trial. JAMA 322:1476–1485)。目前正在进行II/III期Revolution研究,比较抗病毒药物和安慰剂,在第一期主要目标是减少病毒负荷,第三期增加没有呼吸支持的时间。同样,在研究中可以增加干预措施,与平台研究(platform trials)相似。第三,可以根据不断更新的证据,采用效应-适应性随机化来更新分配比例,因此增加患者进入有希望干预组的机会。这样会提高效率,但是在双臂和多臂RCT时也可能降低效率。因此,这也受到争议。

8. 平台研究( Platform trials

平台研究不是比较单一干预措施对于疾病的影响,而是评估多个干预措施的RCT。平台研究可以一直进行,根据适应性特征和决策可能性增加或删除干预措施。如REMAP-CAP研究评估重症摄取获得性肺炎在几个领域的干预措施,包括抗菌药物、糖皮质激素和免疫调节治疗等。通过同时评估多个干预措施以及在利用对照组进行比较,平台研究比传统的序贯双臂研究更有效率。







请到「今天看啥」查看全文