临床试验构成了药物批准所需的安全性和有效性证据支柱。在过去的几十年里,人们认识到,生物医药研究支出的增加既不能提高临床开发成功率,也没有显著减少临床开发到批准的时间。因此,人们需要创新方法来回答复杂问题并提高临床试验效率。
在此背景下,
FDA
启动了复杂创新临床试验设计(
CID
)项目,包括涉及复杂适应性设计、贝叶斯方法或其他需要应用模拟来确定统计属性的情况。这些设计旨在加速药物开发,同时可以为严格的安全性和有效性评估提供证据。
在此,我们介绍两个复杂创新临床试验设计的案例以阐述
CID
的概观。这两个案例虽然没有
入
选 FDA 的 CID 试点
项目,但都是非常典型地使用了某些复杂的设计。其中一个是主方案设计
I-SPY 2
临床试验,另一个是
BI
的
PDE4B
抑制剂
Nerandomilast(开发代号 BI 1015550)的 II
期临床试验,这是一项使用了贝叶斯方法借用外部数据组成混合对照臂的研究。为此,我们会在相应案例前简单介绍主方案设计以及贝叶斯统计和混合臂。
主方案设计
随着生物学、医学和其他相关学科的发展,人们认识到传统
RCT
的一些局限,比如免疫检查点抑制剂的开发打破了既往一直按照不同肿瘤来源治疗的理念,而是按照生物标志物的情况分类而治。另外,进行
“
精准医学
”
试验以评估靶向治疗,这给招募患有罕见遗传疾病亚型的患者带来了挑战。为此,人们创造了新的方法学,主方案设计就是其中一种,它可以在同一整体试验构架下评估不止一种或两种治疗,或者用于多种患者人群类型或疾病。
主方案设计分为三种类型:
篮式设计:使用共同的生物标志物在多种疾病中测试单一疗法。支持
K
药
MSI-H
实体瘤适应症加速获批的一些试验,如
Keynote-016
就是篮式试验。
伞式设计:测试具有不同生物标志物的单一疾病的多种疗法。典型的伞式临床试验为
NCI-MATCH
试验(
National Cancer Institute Molecular Analysis for Therapy Choice
),用于评估携带靶向突变的具有不同组织学特征癌症的多种遗传标志物和相关靶向治疗。
平台设计:在单一的适应性框架内同时评估多种干预措施。与一次测试一种治疗方法的传统试验不同,平台试验是动态的,允许根据决策算法使得疗法进入或离开平台。我们将要介绍的
I-SPY 2
研究就是平台设计试验的一个案例。
2023年底 FDA 发布了
Master Protocols for Drug and Biological Product Development
指南草案,感兴趣的朋友可以进一步了解 FDA 对此设计的建议。
I-SPY 2 TRIAL(
I
nvestigation of
S
erial Studies to
P
redict
Y
our
T
herapeutic
R
esponse with
I
maging
A
nd Mo
L
ecular Analysis
2
)是肿瘤学领域一项开创性的适应性平台试验,它重新定义了乳腺癌治疗的评估方式。它于 2010 年推出,专注于高危、早期乳腺癌患者的新辅助治疗(术前治疗)。该试验是整合了适应性设计、生物标志物驱动的患者分层和贝叶斯统计,以加速药物开发。
I-SPY 2 用于比较新药联合
标准治疗与单独标准治疗之间的疗效,其目的是根据分子生物学特征确定患者亚组最佳的治疗方案。
整体的试验设计如下图所示:试验人群为
患有大的原发性乳腺癌 (>3.0 cm) 的女性;
标准生物标志物用于确定分配治疗:HR 状态 (+/−)、HER2 状态 (
+/−) 和 MammaPrint 状态(MP2 和 MP1);对照组
采用标准新辅助治疗方案,从每周一次的紫杉醇(HER2+ 患者加曲妥珠单抗)开始,然后是阿霉素和环磷酰胺(AC)4 个周期;
在试验组中,将同时测试各种新药,每一种都被添加到标准疗法中;主要终点是 pCR,患者将会随访 10 年来评估次要终点 DFS 和 OS。
经过
贝叶斯预测比标准疗法有效性
概率更高的药物将与其相应的生物标志物信息一起“毕业”,从而允许在较小的 III 期试验中测试这些药物-生物标志物组合。如果治疗方案显示改善的可能性较低,则将放弃进一步研究。
至少有三个试验药从
I-SPY 2
“毕业”,分别是 PARP 抑制剂
Veliparib 与卡铂的联合疗法,
表皮生长因子受体抑制剂奈拉替尼,以及
帕博利珠单抗。
我们简单看一下
Veliparib 与卡铂组合的 2 期数据[1],从下图可以看到对早期三阴乳腺癌患者,试验药
Veliparib-卡铂组的病理完全缓解率估计为 51%(95%
贝叶斯概率区间(
PI
)为 36% 至 66%),而对照组为 26%(95% PI,9% 至 43%),III 期的成功率最高为 88%。进一步的 III 期临床没有见到报道,有可能申办方认为这个成功率还不够高。
而 K 药
帕博利珠单抗的 2 期数据如下表所示[2],
帕博利珠单抗对比标准治疗在早期三阴乳腺癌患者中优效的概率 >99.9%,3 期临床预计的成功率 99.3% 也比选择 HR+/HER2- 的人群更高。因此,默沙东在推荐的早期
三阴乳腺癌患者中开展了新辅助治疗的 KEYNOTE-522 研究。
我们只简单看一下
KEYNOTE-522 研究的两个主要终点结果[3],一个是
病理分期 ypT0/Tis ypN0 患者(乳腺标本和区域淋巴结中无残留浸润性病灶)的病理完全缓解率 pCR,另一个是 ITT 人群的 EFS,相比标准
新辅助化疗,K 药组都有显著获益。因此,FDA 也批准了该适应症。
总之,I-SPY 2
试验显示了适应性随机 2 期平台试验的优势,可将疗法与生物标志物子集相匹配,以更好地为 3 期试验的设计提供信息,从而可能使 III 期试验人群更富集、样本量更小、完成更快
、成功率更高。
贝叶斯统计
统计推断的方法可以分为
贝叶斯统计和频率统计两类
,它们的理念和方法不同。
频率派认为
概率是事件的长期频率(例如,95% 置信区间 confidence interval 意味着重复实验的此类区间中有 95% 包含真实概率)。同样地,
频率统计中的 p 值是假定原假设(也称零假设)为真,观察到的数据比实际观察到的数据更极端的概率。
这也是关于长期频率的,但它并没有告诉我们
原
假设为真的概率。
贝叶斯派认为
概率代表主观的信念程度。参数被视为具有
先验和后验分布的随机变量(例如,给定数据,95% 可信区间
credible interval
包含参数的概率为 95%)。
统计推断是通过下述贝叶斯定理用观测的数据去更新先验
分布获得后验分布得出的
:
其中,
为先验分布,
为后验分布,
为似然
函数
,