专栏名称: 算法与数据结构
算法与数据结构知识、资源分享
目录
相关文章推荐
算法爱好者  ·  判赔 600 万 + 罚 100 ... ·  5 天前  
算法爱好者  ·  美政府再发警告:关键软件勿用C/C++,20 ... ·  6 天前  
九章算法  ·  狗家“悬浮人”,跳槽成功 ·  6 天前  
51好读  ›  专栏  ›  算法与数据结构

辛普森悖论:诡异的男女比例

算法与数据结构  · 公众号  · 算法  · 2016-10-13 10:18

正文

来自:宇宙的心弦

作者:physixfan

链接:http://www.physixfan.com/archives/1024(点击尾部阅读原文前往)

原载于果壳网

已获转载授权


大学的男女比例问题一直是广大宅男同胞所关心的重大问题,也是高中同学聚会时必然谈起的话题,对于选择大学来说,这也是一项重要指标~..


一天,我拿出两个大学(P大和T大)的统计数据开始研究。“物理学院,P大男女比例大于T大;数学科学学院,P大男女比例又是大于T大...哇,怎么所有专业P大的男女比例都高于T大啊...那还犹豫什么呢,我肯定报T大了!”正当我刚刚心意已定的时候,突然看到了统计数据的最后一行:P大的总体男女比例低于T大!“什么?!有没有搞错?怎么可能P大的所有专业男女比例都高于T大,但是整体男女比例却低于T大了呢?!肯定是哪里算错了吧...”于是我拿出计算器狂敲,却发现没有任何一个计算错了的数据,这种情况真的可能发生吗?


多说无益,请看下面编造出来的一份男女比例数据:(其中假设两所大学都只有物院和外院两个专业)


物院的数据:


男生人数女生人数男:女
P大4585.6:1(大)
T大101512.0:1


外院的数据:


男生人数女生人数男:女
P大502010.25:1(大)
T大9920.10:1


学校整体数据(即上述两个专业人数之和):


男生人数女生人数男:女
P大952090.45:1
T大1101430.77:1(大!)


数据可不会是骗人的,不信可以自己动手验算一下,真的出现了这种违背常理的情况!这种现象被称为“辛普森悖论”,虽然这么叫,但其实这不是个真正的悖论,它内部没有包含逻辑上的矛盾,只是违背了人们的常理。


可能有些人还是一头雾水,虽然数据是如此,没错,可是还是不能理解到底发生了什么使得结论如此古怪。让你构造出来一个类似的数据,恐怕你也很难直接想得出来吧!人们对几何图形的想象力总是好于对数字和字母,因此为了更直观地表现出辛普森悖论,我们看下面一副向量图:




图中,黑色的线代表P大数据;红色的线代表T大的数据。Ap点的横坐标为P大外院女生人数,纵坐标为P大外院男生人数;Bp点的横纵坐标则分别为P大总女生人数和男生人数。At和Bt点的意义与之相对应。


设坐标原点为O,则OAp的斜率表示的就是P大外院的男女比例,ApBp表示的是P大物院的男女比例,OBp表示的则是P大总男女比例;T大的各线段斜率意义与之对应。


如此一来,一切都变得清晰起来了!辛普森悖论反映在这张图上,就成了一个显然的事实:在P大的外院、物院两个向量的斜率分别大于T大的两个向量的斜率的条件下,总人数向量的斜率当然不一定哪个大呀!根据这个直观的理解,你也可以随意编造能产生辛普森悖论的数据了吧!


知道了辛普森悖论这一事实之后,我们以后对待统计数据就要更加小心了。 在数学中经常会出现这种出乎人们意料的惊人事实,所以还是一定要学好数学啊~!



本文编号242,以后想阅读这篇文章直接输入242即可。

●输入m可以获取到文章目录。

推荐15个技术类公众微信

涵盖:程序人生、算法与数据结构、黑客技术与网络安全、大数据技术、前端开发、Java、Python、Web开发、安卓开发、iOS开发、C/C++、.NET、Linux、数据库、运维等。