有一个化工厂,一直在排放污染物。环保署早就看它不顺眼了,于是调查人员就去展开调查了。根据环保署的标准,排放浓度的上限是万分之三。所以调查人员就做了抽样调查,通过污染检测值,来判断这家工厂是不是超出了上限,是不是需要让它关门整顿。好了,环保署工作人员不负所望,抽样调查结果发现排放浓度是万分之四,高于排放标准上限。那现在问题就来了:要不要让它关门整顿?
你可能会说:这还用说?超出上限了,当然让它停产了。如果这是你脑子中的第一反应,那说明你还没有真正理解统计学。注意,工作人员做的是抽样调查,既然是抽样,就有可能有误差,也有可能这家工厂并没有达到上限,只是抽样的地方恰好浓度高而已。那这怎么办呢?
这就要用到我们上一讲提到的假设检验思想。假设检验是利用反证法的思想,总是认为“人之初,性本善”,总是把人假设为好人。这次也不例外,原假设是这家工厂没有超出上限,那怎么来证明他到底有没有超出上限呢?当然思想就是:如果这家工厂排放浓度是3(这种情况下,就不会被关门大吉),那么在一次抽样中结果是4,这种概率(P值)有多大?
无论计算的P值有多大,我们只能下一个结论。如果P值大于0.05,我们可能会说,这种可能性是存在的,可能这家工厂的浓度真的是3(原假设成立),调查人员调查结果是4,只是抽样误差而已。如果P只小于0.05,那我们要说,这种可能性太小,所以这家工厂的浓度不可能是3,而是应该大于3。所以,结论要么是公司违反标准,要么是公司没有违反标准。如果你要根据这次调查结果判决的话,你会怎么判断呢?事实上,无论你怎么判断,总有判断错误的可能。错误的可能性主要有两种,如下表所示:
这两种错误也就是统计学中与假设检验相关的两种错误类型:一型错误和二型错误。所谓一型错误,也就是你冤枉了厂家,本来公司没有违反标准,你硬是说它违反了,这种情况下,厂家吃亏了(无缘无故被勒令停工好几个月)。所谓二型错误,就是你放纵了厂家,本来公司超过标准了,你却认为它合理,这种情况下,附近老百姓吃亏了(继续忍受污染)。一型错误通常用α表示,二型错误通常用β表示。
一型错误和二型错误哪个更严重?这取决于你站在哪一方。从环保署角度,可能一型错误更严重,因为错误地控告该工厂,可能导致该工厂恶狠狠地反咬一口,成本很高的。从附近居民角度,二型错误更严重,因为如果没有控诉该公司,这几公司继续排放污染,居民健康受影响。
另外一个例子,有一个人正在以谋杀罪的罪名受审,法官要来判断他是否有罪,如果有罪就面临死刑,如果无罪就当庭释放。假设这个人是无罪的(原假设,依然假设他是个好人),那么你判断他有罪,这就是一型错误。这种情况下,我们希望这种错误越小越好,毕竟,人死不能复生。这时候如果我们还是以一型错误α=0.05这一标准,显然有点太冒失了,我们希望α越小越好,这样才不至于误杀好人。那你可能会说,那我们干脆就把α设为0.000001,那多好,这么小的几率,总不至于判错了吧。
但是这就会带来另外一个问题,我们只是假设这个人无罪,那万一这个人真的有罪呢?把α设的这么小,那你需要收集更多的证据才能真正证实他有罪,也就是说,即使他有罪,如果你把α设的这么小,那你几乎不大可能真的证明他有罪。也就是说,二类错误明显增大(本来有罪,结果没法证实)。
所以,看起来一型错误和二型错误是个彼此消长的关系,一型错误大了,二型错误就小了;一型错误小了,二型错误就大了。那么除了让一型错误变大之外,怎样才能降低二型错误呢?很简单,增加样本量。每一个样本数据就相当于一条证据,证据越多,当然你就越容易证明他有罪。
在介绍二型错误的时候,顺便不得不提一个现实中很重要的概念,即把握度(power),有的也翻译为功效。把握度=1-β(二型错误)。二型错误是如果他有罪,而错误地判他无罪,所以把握度就可以理解为,如果他有罪,而且法官正确地判断他有罪的概率。这个是我们所要追求的,也就是说正确判断你的结论。举几个现实中的例子,如果两种药物疗效确实有差异,把握度就是真的能发现这种差异的概率;如果不同性别的人发病率真的不同,把握度就是真的能发现这种不同的概率。
很显然地,一项研究的把握度越高越好,事实上,很多项目都希望你在写标书的时候能够告诉他们,你有很高的把握度(比如不低于0.8),这样结果才不至于事与愿违,给你支持的钱不至于打水漂。而且现在很多文章也都要求提供把握度,尤其你的结果是阴性的时候(也就是说,可能本来是有差异的,但是你的结果中未能发现,得到了一个无差异的阴性结果)。这种情况下,报告一下你的把握度是很有必要的。如果你的把握度很低,那很可能只是你的样本量不足,或者换句话说,你一开始就设计的不好,没有仔细计算一个合理的样本量,结果导致了你的阴性结果。如果你在计算样本量的时候,就是以一个很高的把握度计算的,理论上是不会出现这种结果的。
所以,如果你想做一个研究,了解一下一型错误和二型错误的概念是很有必要的。只有你自己才最有资格对自己的研究做决断,那么作为法官,你会更倾向于减少哪一类错误呢?
End.
作者:冯国双(中国统计网特邀认证作者)
本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:itongjilove),转载时请注明作者及出处,并保留本文链接。