一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》,报告中说,从薪酬来看,女性的平均薪酬为8689元/月,与男性的9942元/月相差1253元,报告发布后,立马引起网友热议。
大部分民众对平均工资、平均年终奖、人均GDP是不买账的,为什么?这就是犯了统计上滥用平均值的错误。
明确平均值使用的前提条件;正确的应用平均值;
除了关注平均值外,还要搞清楚数据的分布形态;
结合其它指标一起分析(如中位数,极差,标准差等)
1. 专家说,今年全国平均降雨量和去年同期相同,气候正常。(但专家不告诉你北方大旱南方大涝);2. 武汉常年平均温度17.2°C,昆明常年平均温度17°C,所以武汉和昆明一样气候宜人;3. A产品不良率为2%,B产品的不良率为0%;AB两个产品的平均不良率是1%?4. 去年我们一共有50个客诉,平均结案时间是58天,公司规定的目标是60天内要结案;所以我们的结案很准时。某产品寿命服从正态分布,平均值为10000小时,有50%的产品寿命会大于10000小时。
某产品寿命服从指数分布,平均值为10000小时,只有36.79%的产品寿命会大于10000小时。
例:已知某产品每个季度的不良率,求全年度平均不良率。
错误答案1:(1.25%+1.14%+1.15%+1.05)/4错误答案2:(1.25%*1.14%*1.15%*1.05%)^1/4(250+240+300+199)/(20000+21000+26000+19000)(1.25%*20000+1.14%*21000+1.15%*26000+1.05%*19000)/ (20000+210000+26000+19000)QE:你看,7号这天原材料不良率太高了,达到停线标准了!你必须把库存都退给供应商!
SQE:这几天使用的原材料都是同一供应商同一批次的,平均不良率为0.13%,质量没问题!
如果想测试一下自己的统计分析能力,大家可以扫码CDA认证小程序,里面有很多统计学相关的实战测试题,解析很详细,了解自己是否会陷入统计学误区。
20世纪70年代,美国为减少红灯时汽车在路口等待造成的汽油浪费,决定评估是否允许红灯时右转。弗吉尼亚公路与运输局研究后报告声称,允许红灯右转后事故发生率没有显著增加(p>0.05)。若干年后研究发现,允许红灯右转后汽车撞毁的频率比以前提高了20%,行人被撞的频率比以前提高了60%。
问题:
原因:
有很多原因导致数据不服从正态分布;
数据不正态不等于过程不受控;
数据不正态不等于数据造假。
应对对策
如果您也想做数据分析类的工作,可以测测自己的数据分析能力,做到心理有数。
相关不等于因果,但因果必相关;因果关系是相关关系的子集;相关关系可以为寻找因果关系提供指引和线索;采取改善措施要针对真正的原因来改善,而不是针对相关关系采取措施。
CDA新年福利来了!
新年大抽奖,高达500元的课程优惠券,CDA一级、二级纸质教材,扫码免费开启抽奖!