专栏名称: 大叔快评
肿瘤学临床研究及制药企业研发评述
目录
相关文章推荐
金城江悠然网  ·  “比价神器”上线,买药必看! ·  3 天前  
金城江悠然网  ·  “比价神器”上线,买药必看! ·  3 天前  
51好读  ›  专栏  ›  大叔快评

P值有戏≠成功获批,FDA的心思你别猜!

大叔快评  · 公众号  ·  · 2024-11-12 08:53

正文


前言:

从Ⅱ期进入Ⅲ期临床研究,掌握加速推进以及避免失败风险的方法论非常重要。对于每个企业而言,即便面临Ⅲ期负面的试验结果,也不会轻易放弃,而是会进一步分析,力求获得满意结果。本期内容,我将聚焦关注点置于已处于关键Ⅲ期临床研究结果与大家进行深入探讨。


在上课之前,有这么两个小问题……


其一,是不是所有III期研究P值有统计学差异,就一定有临床明显获益,就一定获批呢?其二,如果Ⅲ期研究主要疗效终点未达成P值有统计学差异的情况下,是不是就该放弃,且FDA一定不会批准呢?


相信大家心中可能已有答案,我也会通过三个案例进一步分享。让我们拭目以待,看看这些结果是否能印证大家心中的答案。



让我们先来了解一下,Ⅲ期试验的统计学考量!


A.Ⅲ期试验成功的统计学标准

从统计学考量来看,试验成功的判定必须要有统计学差异。


首先,主要终点是否达成。P值是统计显著性的度量。临床研究中,统计学显著性的阈值通常设定为0.05(5%)。“P≤0.05”具有统计显著性,并以此作为判断临床研究是否失败的主要依据之一。


其次,次要终点试验有效性的补充。如果主要终点以及次要终点的P值均大于0.05,那么研究人员可能会有两种选择。一是,宣告临床研究的失败。二是,引入“Spin”概念。临床研究结果的Spin是指在一项主要结果无统计学意义的临床试验中,被定义为尽管主要结果没有统计学差异,无论出于何种原因,通过使用特定的报告策略,强调试验治疗是有益的,或分散读者对无统计学意义的差异的注意。这种做法可能会夸大结果的重要性或影响,或者试图隐藏研究结果中的不利部分,会让读者对结果产生误解,但它也有正面意义。

图1



从统计学角度来分析Ⅲ期试验成功的标准。以主要终点PE和次要终点SE及对应的P值进行划分。如果P≤0.05,通常认为试验成功;若P>0.05,则为试验失败。


当主要终点P≤0.05有统计学差异时,如果次要终点也P≤0.05有统计学差异,这个无疑实验是成功的,通常情况下FDA 都会获批。若次要终点P>0.05,在心血管等领域常见的复合终点实验中,就需要进一步分析拆开复合终点的次要终点是否都能获益。这时可能需要用到Spin概念来进一步判断试验是成功还是失败。


当主要终点P>0.05没有统计学差异时,从统计学上是负面的试验结果,但也不能就此放弃。在次要终点P>0.05时,可能会根据不同的需求考虑Spin的分析;但有些研究在虽然主要疗效终点P>0.05没有统计学差异但次要疗效终点P≤0.05时,有些是可以解释主要终点失败原因的,药监部门也有可能在有临床需求的前提下根据次要疗效终点结果获批。


因此,在解读临床数据时,有以下两点需强调:第一,虽然P值有统计学显著性差异,但不一定都有临床意义,不应该一叶障目地完全凭借P值来解读临床试验的结果。在现实世界中,P值达到了统计显著性而被FDA否决的项目也并不罕见。FDA更重视的是临床益处,而统计显著性是另一个供参考的维度。第二,有的Ⅲ期研究虽然主要疗效终点没有达成,FDA也会根据临床需求和获益予以批准。


B.重视相对优势的同时也要看绝对优势

图2



相对风险RR对于疾病的病因学意义较大,绝对风险ARR对疾病的预防的意义较大,而需治疗人数NNT可以直接告诉我们,一项干预措施可以让1个人获益时,未获益的有多少人。NNT与ARR一般呈反向关系,ARR越高,NNT越低。


以治疗心衰的A药和B药为例。从死亡发生率看,两者RR都降低了50%;A药ARR降了10%,B药ARR降了40%。从这个案例能清晰看到,A药相对风险降低少,NNT为10,即治疗10个患者才能使1个患者获益;B药绝对风险降得多,NNT为2.5,治疗2.5个患者才能使1个患者获益。在现实中,不可能出现心衰患者人群里对照组差别这么大的情况,只是以此说明相对优势和绝对优势都需考虑。




之后,让我们带着问题进入案例分析环节!


Q1:是不是所有Ⅲ期研究P值有统计学差异,就一定有临床明显获益,就一定获批呢?

案例一、全身性重症肌无力(gMG)

萨特利珠单抗是一种白介素6(IL-6)受体拮抗剂,可用于治疗抗水通道蛋白4(AQP4)抗体阳性的成年患者视神经脊髓炎谱系疾病(NMOSD,罕见病)。2020年8月国外批准上市,国内2021年4月批准上市。通过萨特利珠单抗治疗gMG,尽管其主要终点具有统计学显著性,但Ⅲ期研究结果并未达到预期的临床获益水平。

图3



其入组人群均≥12岁,确诊为gMG患者,要求筛查时MG-ADL总分≥5分,其中非眼部项目占总分50%以上,严重程度Ⅱ-Ⅳ级,在持续稳定剂量的基础治疗上进行研究。这是一项随机对照研究,分为安慰剂组和萨特利珠单抗组,在24周时观察AChR-IgG +人群MG-ADL评分较基线的变化等指标。24周结束后,出于伦理考虑,会将安慰剂组患者转移至萨特利珠单抗组,让患者继续获益。


据研究结果显示,主要终点在第24周与安慰剂组相比,MG-ADL评分较基线的平均变化具有统计学显著性(P = 0.0196)。与安慰剂组相比,在基础治疗上加用萨特利珠单抗仅使MG-ADL评分降低了1.02分,其研究结果并未达到预期的临床获益水平。其他次要终点未公布,安全性特征与其他研究一致,未出现新的安全信号。此外,从关键临床评估表可以看出,对于中重度患者使用该产品与安慰剂相比却没有明显降低,这可能是临床获益方面的一个重大担忧。


基于此,根据国外研究和临床研究共识,对于研究终点MD-ADL评分,2分或以上改善对预测临床获益的改善具有积极意义,根据既往批准的相关药物经验,监管部门也基本认可。萨特利珠单抗的Ⅲ期LUMINESCE研究主要终点MG-ADL评分较安慰剂组仅有1.02分的改善,尽管达到统计学差异,但从临床获益的角度,并未达到预期,想让FDA批准是很难的。


案例二、首个KRAS抑制剂Sotorasib

Sotorasib(LUMAKRAS)是首个获加速批准的KRAS G12C抑制剂,加速批准基于Ⅱ期研究CodeBreaK100在经治非小细胞肺癌(NSCLC)队列结果,如ORR 37%、DoR 10月、PFS 6.8 月,是上市后要求的一部分。最终投票结果为2票赞成,10票反对,以不支持验证性研究CodeBreaK200主要终点PFS的可靠性落幕。由于其加速批准的研究是单臂研究,在此结果下要求进行上市后验证性临床研究。

图4



从该案例结果来看,与对照组相比,Sotorasib仅延长了1.1个月。从临床角度直观来看,这样的临床获益不明显且没有统计学差异,其OS不仅没有延长,反而比对照组还短了1个月。因此,完全不可能获得FDA批准。


虽然辉瑞的哌柏西利(CDK4/6抑制剂)的OS只延长了2个月,也没有统计学差异,但其PFS延长10个月,存在后线交叉等问题,可能影响OS数据。所以,只要PFS足够长,FDA还是有获批的空间。因此,从这个角度看,Sotorasib未得到获批也在情理之中。此外,肿瘤评估通常是6周/次,但其延长时间<6周,也说明这并不是一个特别好的结果。


案例分析结论:

A.药物上市的关键点是需要有临床获益,不仅仅需要达到主要终点的统计学差异。


B.若某适应症已有较多上市药物,新药获批前提是不仅要有临床优势,主要终点还需要有较显著的统计学差异。


C.关键次要终点也有重要的参考价值。



Q2:是不是所有的III期研究在主要疗效终点没有达成P值有统计学差异的情况下,FDA都不会批准呢?

案例三、沙库巴曲缬沙坦

沙库巴曲缬沙坦是新型高级共晶体,不是单片复方制剂。其共晶结构可以使沙库巴曲与缬沙坦的吸收与消除速率相近,保障了两者药效发挥的同步一致性。该案例主要针对心衰适应症,包含PARADIGM-HFrEF和PARAGON-HFpEF两个研究。


A.PARADIGM-HFrEF研究

图5



该实验设计看似简单但也有其用心之处。首先,选择了依那普利作为对照。在单盲导入期,先导入依那普利,后导入诺欣妥且从100-200mg的剂量逐渐递增。这保证了试验用药在更加安全、耐受的情况下进入随机入组阶段,从而更保证了该组患者的安全性。


根据实验结果显示,诺欣妥与依那普利相比,其主要终点风险下降了20%,P=0.001,有明显统计学差异。另外,诺欣妥在心血管死亡风险和心衰住院风险方面均明显降低,P值有统计学差异;全因死亡率也降低了16%,同样有统计学差异。因此,诺欣妥在该适应症上的实验无疑大获全胜。







请到「今天看啥」查看全文