随着时间的推移,以随机、双盲、对照为特征的大规模临床试验尽管依然是检验创新治疗方法安全有效性的金标准,但临床试验的经济性和合理性正在受到越来越多的诟病。病人团体声称大规模的临床试验耗时费力,不但不适宜罕见疾病治疗方法的研发,而且会拖延可能挽救生命的突破性药物进入市场的速度;制药公司认为动辄耗时数年、起码入组数百个病人的三期临床试验大大推高了新药研发的成本,也让一些中小型生物制药公司无力承担临床试验的相关费用;激进的市场化政策推动者倡导以一种机械的“市场决定”模式代替臃肿庞大的美国食品药品管理局(FDA),宣称只要药品的安全性得到保证,不管有效性存在与否,都应该被许可在市场上销售,因为市场竞争和理性的消费者会让真正性价比高的药物自然胜出。
在这样的大背景下,真实世界证据(Real-World Evidence,RWE)很自然地得到了人们的推崇。真实世界证据几乎处于传统临床研究的反面:传统临床试验往往是前瞻性的,真实世界研究大多数是回顾性的队列研究和病例对照研究;传统临床试验耗时费力,临床试验流程繁琐,涉及巨大的药品和人员开支,相对地,真实世界研究的研究者只需要花费数千美元就能够获得包含数百万病人病历的医疗数据,可以通过较小的成本取得具有与临床试验同样价值的信息;传统临床试验以医生和实验室客观指标为中心,代表一种冷冰冰的老式“生物-医学”模式(biomedical model),而真实世界研究以病人为中心,是一种充满温情的“生物-心理-社会医学”模式(Bio-Psycho-Social Model),将患者的主观感受放到与客观指标同样重要的位置。即使他们的研究成果都有不同的专业名词定义:真实世界研究获得的是一项治疗方法的“效益”(effectivness),而传统临床试验在高度人为干预情况下获得的结果被称为“功效”(efficacy)。
这种粗暴的分类人为地把真实世界研究与临床试验放到了对立的位置,但事实并非如此。真实世界研究与临床试验并不是简单的二元关系,两者无论是在概念上,还是在应用中都互相重叠和有机交叉,在实际操作的同时也会相互借鉴彼此的长处。
在前些日子召开的ASCO与ISPOR年会上,专家们将这两种类型研究的定义和适用范围作了更加准确的界定。因此,正确的说法应该是:真实世界研究与临床试验殊路同归。
临床试验的制定者不断通过各种方法改进试验设计,增强临床试验在真实世界的结果可外推性。因为临床试验存在一定的风险,为了保证试验能够达到预定的目的而不被各种不可控因素干扰试验结果,历史上临床试验的设计者倾向于使用相对较为年轻和健康的患者进行临床试验,哪怕他们仅仅是真正病人群体的一小部分。因为只有这样,一方面当发生例如肝肾功能损害等严重不良反应时,研究者可以有较大把握认为这个是药物的安全性问题,而不是病人本身的疾病进展导致的。另一方面,这些相对健康的患者往往对治疗有较好的反应,体现在治疗效果上就是更高的好转率、缓解率和痊愈率,新药因为这些漂亮的数据更容易获得审批。因此,制药公司心照不宣地采用这种办法获得监管部门的市场准入许可证。
然而,一旦药物进入市场,医生们立即面临他们接诊的病人和临床试验中的病人不一致的问题。比如,临床试验少有高龄老年人参与,少数民族和女性也很少被纳入临床研究的范围当中。那么,临床试验的结果就不能直接用于这些病人治疗的临床决策。医生们在直接医疗证据缺乏的情况下治疗这些非标准化病人会有很多困难。
因此,当今的临床试验强调纳入多样化人群,提高试验结果在真实场景的准确性。研究中心不仅创造条件让所有人群,包括不同年龄、不同教育背景、不同收入、不同种族的病人都有机会获得新药,也创造条件有意识地吸引一些既往不那么愿意参加临床试验的人群,甚至在试验设计上,在入组时增加这些人群的比重。尽管可能因为病人的多样性导致试验结果准确性降低,但是却保证试验结果的可外推性,即外部有效性。
另一个日渐流行的趋势是实用试验(Pragmatic trials)的兴起。实用试验的重点是临床试验尽可能模拟真实治疗场景的情况,用较少的约束条件观察大样本病人对某些治疗方法的疗效和安全性。在这种减少干预情况下获得临床研究数据具有可接受性强、成本较低、操作灵活等优点。在一些公共卫生和临床质量改进的项目中得到了广泛的应用。
此外,病人报告结果和经济学指标也被逐渐引入临床试验。以病人为中心并不是简单的口号,病人报告的临床结局从病人角度出发,搜集病人的心理学、治疗满意度、社会适应等多维度的考察指标。在某些疾病,比如慢性疼痛和风湿性疾病,病人报告的疼痛指数、客观活动受限水平以及疲劳程度等,有时可以成为FDA批准创新新药的关键依据。
在临床试验中采集经济学指标也是现在的研究热点。这类研究被形象地称为“背驼式研究”(piggyback study)。在临床试验的过程中搜集经济学数据,包括但不限于直接医疗费用数据,间接差旅费支出、劳动生产力损失等经济学数据,可以更加全面地考察某种治疗方法对个人、家庭以及社会的不同层面影响。
与此同时,真实世界研究也在进行着各种减少偏倚的努力。回顾性研究最为人诟病的一点就是存在各种偏倚。相比于能够通过随机化方法平衡病人的异质性,回顾性研究无法从根本上解决试验组和对照组很大程度上缺乏可比性的问题。一个经典的例子是某些试验发现饮用一定量的红酒能够降低心血管的发病率,但是饮用红酒的人群往往是社会经济水平较高的受教育人群,这里很难就红酒是不是能够降低心血管意外的发病率这个假设给出绝对的结论。假设我们把烟草的价格定到一个天文数字,那么就可能在回顾性的研究中观察到烟草与长寿的关系,其实可能长寿仅仅取决于个人的富裕程度,而不是与使用烟草和红酒有关。
其次,真实世界研究进行着方法学的创新,更好地使用在现实生活中不断产生的海量数据。我们经常在媒体报道上看到的大数据、机器学习、人工智能等,已经被用于一些回顾性研究的方法学创新当中。研究者可以通过人工智能,归纳出高危病人的一些特征,这样就能够在疾病进展之前就重点针对性干预,减少因病致残和死亡事件的发生。
再次,在整合不同临床研究数据进行二次数据分析当中,真实世界研究的从业者进一步重视整合结构性与非结构性的数据。除了实验室检查、体格检查、过敏史等较容易被量化的结构性数据,越来越多的非结构性的数据现在也能够通过定性和定量的手段进行研究。位于美国波士顿的Flatiron Health公司就是以搜集医生手写输入的个体病案信息、不同格式类型的病理报告数据而闻名。整合结构性与非结构性的数据让这家公司在肿瘤个体化精确治疗的细分领域成为龙头。
最后,真实世界的研究同样强调严格遵循既定的研究策略,不选择性报道阳性结果。试验者可能使用不同手段对数据进行全方位的分析,却只报道对其最有利的分析结果。这种做法被称为“钓鱼” (fishing)。如今,真实世界研究的研究者会像传统临床试验一样,在分析前就将分析计划确定下来,最大程度地减少选择性报告偏倚。
在今年的ASCO会议上,大会组织者高调宣布CancerLinQ将与FDA合作,考察各种新批准的抗肿瘤新药在真实人群中的可靠性。CancerLinQ作为成立不久的科研实体,近段时间在资本的青睐下刚进行了快速的扩张,其触角已经延伸到了美国40个州和华盛顿特区。
这家公司搜集全美不同类型肿瘤诊所的真实病人数据,再在匿名化后使用创新性大数据引导个性化的新药研发,帮助FDA进行新药批准的决策。另一方面,药品监管部门在加速药品审核的前提下不会放松对药品安全性的严格要求,海量数据能够更快核实罕见的药品不良反应,也帮助实时监督药品的安全性问题。
也许,CancerLinQ作为整合临床试验和真实性研究的桥梁,正是卫生经济学与结局研究的主要发展方向。
我们处于一个高度变化的时代,真实世界研究和临床试验不会是相互对立的关系,而是共同发展,不断从对方汲取有益的部分,减少自身的缺陷。随着时间的推移,两者的界限会变得更加不明显。正如美国FDA肿瘤资深专家Sean Khozin医生在ASCO年会上所说的那样:“我们需要跨越随机对照试验的限制,使用真实世界数据来指导医疗系统改革和卫生政策的制定。”
(本文作者系药物经济学研究者,供职于美国伊利诺伊大学芝加哥分校)
■编辑 慕欣
★更多深度报道见《医药经济报》~