前一段时间看了一个小文章说,P值已死。为什么?因为P值根本起不到我们期望的作用,甚至更绝望地说,P值根本就起不到这个作用。
那么,P值到底是干什么的?只是上帝派来玩弄我们的吗?它到底是真有用还是我们想的太多了?本文简单谈一下自己的一些小看法。
简单说一下P值的历史,P值是由统计学界最牛的人Fisher老先生(相当于物理领域的牛顿级别人物)提出并推动的,这来源于他以及以后由奈曼和皮尔逊发展的假设检验思想(假设检验会在以后文中专门介绍)。简单地说,如果你有一个50人的班级,已经知道你们班上50人的身高平均是4250px,如果现在给你1个人,身高是4750px,那么让你来判断,这个人是不是你们班的人?
对于这个问题,你会怎么判断呢?很明显,两种答案,要么是,要么不是。通常我们会假定他是这个班上的人,因为即使是平均身高4250px,但也不是所有人都4250px,肯定有高有矮,高的人是有可能达到4750px的。但是我们不得不承认,对于一个平均身高是4250px的50人来说,出现一个4750px高的人,这种几率是相当低的。这个“几率”就是P值。
换句稍微专业一点的术语来说,对于一个均值是4250px的总体,有人的身高比均值高500px,如果这个人真的是这个群体中的,那么出现500px这么大的差异的概率有多大?这个概率就是P值。如果这个概率很小(如P值=0.01),那就可以说,出现这么大的差异的概率只有百分之一。对于这么小的概率,我们认为它不大可能出现,也就是说,这个人不大可能是属于这个群里中的,更大的可能是属于其他群体中的。
现在还面临一个问题,P值到底小于多少,我们才能下结论认为这个人不大可能属于这个群体呢?换句说话,小于多少才算“不大可能”?现在我们通用的标准是0.05,也就是说,概率小于5%,就认为“不大可能”。那这个0.05是怎么来的呢?这个0.05也是Fisher老先生提出来的,可是他没有对此做任何解释,只是说他突然想起来了,或许觉得0.05是他的幸运数字吧,然后就用0.05了,然后我们就一直沿用了。
不管0.05是Fisher老先生的一个偶然想法还是怎么样,起码我们真的就有了一个标准了。只要能统一,始终是好事的,尤其在以前的时候。不过在当前计算机已经超级发达的时代,有这么一个标准就不一定是好事了。很多人都曾有过这种经历,P值正好等于0.049或0.052之类的。等于0.049的,感觉神都在眷顾他;等于0.052的,恨不得一头去撞墙。也有人问过我,我的P值等于0.052,我可不可以四舍五入到0.05?
实际上,对于P值等于0.052之类的问题,也不用太烦恼。现在的杂志一般都要求提供具体的P值,而不是简单写为P
比0.05多了千分之二的可能性,难道你觉得增加这千分之二的可能性可以让你推翻你的结论吗?我相信大多数人都不会这么认为。所以你大可不必纠结于想方设法非要改成小于0.05的事情,大大方方地把自己的P值放上,我想读者会有自己的判断的。如果一个杂志因为你的P值=0.052而拒绝承认你的结论,我想这个杂志也不值得发表。
目前仍有人认为P值代表了差异大小,认为P值越小,差异越大,因此力求一个小的P值。而事实上,P值跟差别大小没什么太大关系,真正有关的反而是其他因素,比如例数的多少,这是个很重要的因素。例数少的话,就容易出现一个大的P值。以前就有临床大夫质疑统计学,说:你看你们统计学,20个数据P值就大于0.05,我原封不动地复制成200个,P值就小于0.05,有统计学意义了。这不是在玩数字游戏吗?
我要说:你说的恰恰相反,20个数据时, P值大于0.05,不让你有统计学意义,是在给你一个提醒,说明你的数据不足以支持你的结论。就像是你治疗了20个人,即使都治好了,你如果宣称治愈率100%,估计没人会相信你。但是200个人就变成P值小于0.05,这正好说明了结论更可靠了,如果你对200个人治疗还是都治好了,那你这时候说治愈率100%,我相信一定会有更多的人相信你。所以,好好想想P值吧,它是有现实意义的。统计学不是数字游戏,而是让你的结论更有说服力。靠什么来体现你的结论的说服力呢,P值。
End.
作者:杨老师 (中国统计网特邀认证作者)
本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:itongjilove),转载时请注明作者及出处,并保留本文链接。