在老奸巨猾的老炮面前,小白虽勇气可嘉,但总显得有点愣头青
历史上首次,NEJM在同一天发表了两个肠癌早筛研究。
从版面上看,血检肠癌早筛的ECLIPSE研究作为“新面孔”占据了更大的篇幅,而代表了Exact Sciences心血的BLUE-C只能屈居次席。
之前也有朋友做了简单的分析,但确实有点过于简单了,完全无法满足我们吃瓜的需求
事实上,这是一次极好的机会,几乎同时期开展的两个研究可以让我们尝试看到肠癌早筛路线之争的当前答案。
可以从这么几个角度来吃瓜:
-
详细的性能比较
-
结论中的“诡计”和“疑点”
-
小白和老炮的“斗法”
PS:
本文仅代表个人观点,受限于自身的视野、阅历及认知,欢迎探讨。
在两篇NEJM中,ECLIPSE和BLUE-C的统计口径是有些差异的,因此并不是所有指标都能被一一对照。
在尽可能统一口径之后,双方可比的检测性能参数如下:
整体来看,姜还是老的辣,早筛还是带FIT的香。
Cologuard 2.0的性能无疑更为漂亮:
不仅有着非常清晰的“随着分期爬坡的敏感性”,在晚期癌前病变上更是展现出了碾压性的优势(43.4% vs 13.2%)。
反观Guardant Shield,性能在跨期别之前的爬升太过陡峭且毫无过渡,看着多多少少有点“晚期过拟合”的嫌疑😂
当然,Guardant将晚期癌前病变上的拉胯表现归咎为目前基础研究的不到位。
但,这是仅有的看点吗?
细看这两个临床试验,里面充斥着数字的诡计和小心思。
在评估一个筛查产品的时候,PPV和NPV是非常重要的指标。
按理说,大家敏感性/特异性差别明显,PPV和NPV也会拉开差距的吧?
然而,事实上二者在肠癌上的表现是这样的:
似乎,没什么差别?问题出在哪?
问题出在发病率上,ECLIPSE人群中的肠癌发病率是0.42%,BLUE-C中是0.5%,都是一个极小的发病率。
而不管NPV还是PPV,固然和敏感性/特异性挂钩,但更直接相关的是发病率。
举个例子,如果一个疾病的发病率是0.5%,那么所有早筛产品的NPV都会是至少99.5%起步。
同样是在ECLIPSE和BLUE-C中,面对发病率超过10%的晚期癌前病变(10.8%/11.1%),PPV和NPV的差距立马就拉开了。
下面这张图会看的更明显——Guardant Shield和Cologuard 2.0的阳性人群分别都是什么情况。
其实在比较性能之前,我们首先要看的是:这两个研究是否“被动了手脚”。
常见的动手脚是做了刻意的人群筛选,比如:让分期后移,通过增加晚期患者的比例,来“修饰”敏感性。
作为几乎同期开展的两个临床试验(ECLIPSE, 2019.10-2022.09;BLUE-C, 2019.11-2023.01),患病人群的分期情况如下:
说实话,这个比例有点奇怪。
BLUE-C的人群是40+,而ECLIPSE是45+,唯一的入组差异是前者排除了过去两年做过第一代cologuard的人,而后者排除的年限是3年。
理论上,BLUE-C的人群应该更“低危”。
结果,BLUE-C不仅发病率更高(0.5% vs 0.42%),III期的占比也更高(34.7% vs 26.2%),II期和IV期的占比也有点奇怪。
也许只能夸Exact Sciences临床运营做的更好,找到了“更需要筛查”的人群?
当然,在ES的口径里,“和我们不一样的都是因为他们不严谨”
按理说,手牌差到这个程度,Guardant Health已经可以选择电脑托管了。
但倔强的小白还要抗争一下:主打一个“依从性”
甚至不惜“移花接木”的在一个“拒绝了常规筛查的人群”中再次和FIT来进行依从性PK。
当然……GH是不会告诉你这个依从性是30.5% vs 13.0%的……
相比之下,老炮Exact Sciences就老辣了许多,招招致命。
比如最重的一招:
“依从性再好,有效性是个辣鸡也不行啊”——这招之狠,几乎就是在明示CMS压低Guardant Shield报销价、甚至拒绝支付。