专栏名称: 医学检验废品加工车间
医学检验废品加工车间:检以求真,见微知著,妄图从检验的旧仓库发现宝贝,从而变废为宝。
目录
相关文章推荐
超级数学建模  ·  我不小心拉在了男朋友脸上,我... ·  3 天前  
超级数学建模  ·  限时领 | Oxford ... ·  2 天前  
超级数学建模  ·  懂中式美学的人,真不简单! ·  4 天前  
超级数学建模  ·  这也太香了!一口酥脆,根本停不下来! ·  4 天前  
51好读  ›  专栏  ›  医学检验废品加工车间

生化免疫检验学底层原理系列(二):概率的真相——单纯使用灵敏度与特异性预测准确率带来的谬误

医学检验废品加工车间  · 公众号  ·  · 2024-06-03 12:04

正文

Hello,everyone! Welcome to my channel.

今天我们来讲讲检验中的概率学问题。在此之前先容我讲一则故事。


概率小故事


01

淘金

故事发生在一座矿山当中。矿山中有一种稀有矿石中,矿石内含金元素,但是这种矿石却十分稀有,只占到总矿石量的1%。也就是平均每100块矿石中只有1个含有金元素的矿石。此时你有一个十分先进的随身探测器,这种探测器能探测到矿石内是否含有金元素。如果矿石内含有金元素,那么这种探测器则100%会探测出来;即使矿石中不含有金元素,那么这种探测器也有90%的准确率。如果想要100%判断矿石内是否真的含有金元素,就只能将矿石送至专业检验室内才能判断。


某一天挖矿时,你使用随身探测器检测一块矿石,发现探测器出现反应,认为该矿石是含有金元素的。你想将这块金矿石远低于市场价便宜出售卖给我。那么我会接受吗?我如果收购这块矿石,里面要是含有金元素,那可就赚大发了。可是事实呢?

02

背后的真相

看似一个很划算的交易,毕竟探测器有90%的准确率,只要不是运气太差,就不会出现问题。其实则不然,不要被表象所迷惑。我们要看清内在的原理。让 我们来进行详细地分析。
假设此时有1000块矿石,按1%的金元素含有率来计算,那就是这堆矿石中只有10块含有金元素的矿石。可以确定的是,这10块矿石中都会引起探测器的反应。那剩下的990块矿石则会分成两 种情况。第 一种,这990块矿石中的90%,也就是891块矿石不会引起探测器的响应。而第二种则是,这990块矿石中剩下的的10%,也就是 99块矿石错误地引起了探测器的响应。

综上可得,总计会有109块矿石引发探测器响应,但是这其中只有10块矿石才是含有金元素的矿石。而你卖给我的这块矿石就是这109块矿石的其中一个,此时就很容易判断出,我获得真矿石的占比只有10/109,也就是我获得真正的金元素矿石的概率只有约9.2%。我会用这么低的概率买一块金矿石吗?显然不会。

03

条件概率

这个故事结果是不是出乎你的意料。那么为什么这笔交易看起来是十分划算的呢?原因就在于统计学上的“ 基本比率谬误 ”,人们往往会通过“代表性”来评估概率,从而忽视“基本比率”。此时你的注意力往往都集中在探测器的高准确率上,脑中几乎只会想这个概率,是直觉让你忽略了其他因素。金矿石本身是十分稀有的,但由于检测设备会有10%的错误率,远高于矿石的含有率1%。此时只要检测设备响应,大概率就会出现假阳性。
而这正是概率学中的条件概率案例,答案并不在于找到金元素的总体概率,也不在于收到检测设备误报的总体概率。 在最终结果揭晓之前,我们仅仅依赖于主观上的经验估计,根据事先已经得到的部分信息去推断最终的结果,甚至于带有自身的偏见和主观臆测。 这种情况我们称之为“先验概率或无条件概率” 我们想要的真相是在接受到正确的检测设备结果信息时获得真正含有金元素矿石的概率。 而这就是“后验概率或条件概率” 。先透过观察,将几率缩减之后再决定其结果。或许大家对“假阳性悖论”十分头大,这就是因为大家会将注意力集中在特定的“信息茧房”之中,从而忽略了其他“普通但有用的信息”,特别是需要在做出决定时,这就会导致判断失误



预测率


在医学检验日常应用中,假阳性结果会导致临床误诊,而假阴性结果又会导致临床漏诊。而我们平时最常接受到的信息却是某一试剂的灵敏度及特异性。正如上面的故事,在灵敏度100%和特异性90%的情况下,我们的阳性准确率却仅有9.2%。 问题究竟出在哪里? 事实就是我们忽视的某一疾病的患病率。为此医学检验领域提出了一个概念——阳性预测率和阴性预测率。



预测率




1
阳性预测值(positive predictivc value,缩写PPV)

由诊断试验检测为阳性的样本中,真正患者所占的比例为阳性预测值。阳性预测值主要受患病率的影响,患病率越高,则阳性预测值也高;临床医师根据某病的患病率和诊断试验的阳性结果就能预测就诊者患某病的可能性大小;当患病率一定时,特异性越高,阳性预测值越准确

2
阴性预测值(negative predictive value,缩写NPV)

由诊断试验检测为阴性的样本中,真正无病者所占的比例为阴性预测值。当患病率一定时,诊断试验的敏感性越高,则阴性预测值越高。

换言之,实验室人员每审核一份定性项目报告,这份报告(或阳性或阴性)的准确率就取决于阳性预测率和阴性预测率。 生产厂家宣传材料上的高灵敏度和特异性有时也很容易迷惑检测人员了。先看看这张表格就知道,患病率是如何影响阳性预测率和阴性预测率的。

在假设某一检测试剂的灵敏度和特异性均为99%的情况下,不同患病率对NPV和PPV的影响如下:

同样的检测能力下,患病率的不同对诊断的影响已经不言而喻了。这也正好解释了为什么一些罕见病的诊断往往是比较困难的了。
此时根据相关定义,我们设定灵敏度为SE,特异性为SP,患病率为P,经过化简,推导出PPV和NPV的计算公式如下:

从公式中我们还要意识到一个现象,那就是99%的特异性和灵敏度与99.9%的特异性和灵敏度的试剂性能差距有多大。根据上述公式计算,在某病种患病率为1/10000的情况下。99%的特异性和灵敏度的试剂,其PPV为0.98%;NPV为99.998%。而99.9%的特异性和灵敏度的试剂其PPV为9.08%;NPV为99.999%。所以别小看这小数点后的差异,最终表现在定性项目的PPV中已经差距非常大了(所以不要相信99%的这种数据已经够用的这种销售鬼话,每提高一点特异性最终都会在实际诊断中对应的表现出来)。







请到「今天看啥」查看全文