专栏名称: 生活统计学
平台致力于将统计学基础与生活实例联系起来,带大家走进生活统计学的世界。介绍统计软件SPSS/SAS/Minitab的生活统计运用技巧。
目录
相关文章推荐
每日豆瓣  ·  牙都刷烂了,为啥牙齿缝隙还是这么脏! ·  4 天前  
每日豆瓣  ·  沉香、龙涎香、鹅梨帐中香......传说中的 ... ·  5 天前  
合肥市场监管  ·  吃好喝好玩好!这份春节消费提示请拿好→ ·  3 天前  
合肥市场监管  ·  吃好喝好玩好!这份春节消费提示请拿好→ ·  3 天前  
51好读  ›  专栏  ›  生活统计学

SPSS分析技术:Kruskal-Wallis H检验;对标方差分析

生活统计学  · 公众号  ·  · 2017-09-26 18:00

正文

基础准备

前面我们详细介绍了多种非参数检验的秩和检验方法,它们适用于不同的数据情况,大家可以点击下方链接回顾:


今天草堂君要给大家介绍的是多个总体间比较的非参数检验方法Kruskal-Wallis H检验。Kruskal-Wallis H检验用于分析多个总体(大于等于三个)间的差异,它其实是两独立样本Mann-Whitney U检验的推广。在参数检验中,与Kruskal-Wallis H检验对标的是方差分析。


Kruskal-Wallis H检验

前面草堂君有说过,非参数检验是参数检验的补充,因为从分析原理上说,其分析精度没有参数检验来得高。当多个数据总体的分布未知或不服从正态分布,定序型数据,可采用Kruskal-Wallis H检验代替单因素方差分析。


Kruskal-Wallis H检验的步骤

1、将来自k个总体的样本数值合并,然后按从小到大的顺序排列,记录下每个数值的序号(秩)。如果有些数值大小相同,即秩相同,那么取它们秩和的算数平均作为秩。


2、计算每个样本数值的秩次秩和,计算检验统计量,Kruskal-Wallis H检验的检验统计量为H,计算公式为:

当所有数值中,排名(秩)相等的数值个数超过35%时,需要用修正因子对H统计量进行修正,修正因子的公式为:

将修正因子代入H统计量的计算公式中,形成新的H统计量,从下方的统计量计算公式可以知道,修正因子使得H统计量略为增大,当H接近于检验临界值时,修正因子非常重要。

H的值标志着k个样本中秩的分布情况。H值越大,秩的差别越大,若H值大于在假定所有样本都来自同一个总体的临界值时,则拒绝原假设,认为多个样本来自的总体分布不同。


用一个具体的生活案例来对Kruskal-Wallis H检验的步骤作详细介绍:某个生物学家想知道某种野鹿对栖息地是否有喜好顺序。他带着学生进行野外考察,选取松林地带、杉树地带、白杨树地带作为考察环境,在每个环境中划出面积相等的几块区域,统计在一段时间内,区域内出现的野鹿数目。数据结果如下:松林地带四块区域(12,11,8,6);杉树地带四块区域(8,10,4,5);白杨树地带三块区域(13,7,9)。


很明显,上述数据的总体是分布形态未知的,因此无法使用方差分析,只能退而求其次,用非参数检验看看三个样本是否来自同一个总体。数据经过处理后,做出下表:

11个数值中有2个数值重复,不足35%,因此不必用修正因子,该案例H统计量的数值为:

查Kruskal-Wallis H临界值表,三个样本量(4,4,3)对应的显著性为0.05的临界值为5.598,而2.0417小于5.598,接受原假设,认为三种栖息环境的野鹿密度没有显著性差异。


SPSS案例分析

利用SPSS对上述案例进行计算,看看软件计算结果与手动计算结果是否一致,加深对Kruskal-Wallis H检验的理论理解。将上面两个案例的数据整理进SPSS,如下图所示:

(例题数据文件已经上传到QQ群中,需要的朋友可以前往下载)


分析步骤

1、选择菜单【分析】-【非参数检验】-【独立样本】,在跳出的菜单中进行如下操作。点击【目标】菜单,选择定制分析。


2、点击【字段】子菜单,将野鹿数目选为检验字段,将栖息环境变量选为组。


3、点击【设置】子菜单,选择克鲁斯卡尔-沃利斯单因素ANOVA检验(k个样本);点击【运行】按钮,输出结果。


结果解释

1、K个独立样本Kruskal-Wallis H检验汇总结果。从结果可知,检验显著性为0.359,小于0.05,说明三种栖息环境的野鹿数目分布没有显著性差异。


2、可视化检验结果。双击上方检验汇总表格,跳出详细检验步骤结果。下图显示三种栖息环境的野鹿数目情况;可以发现,三种栖息环境的野鹿数目都存在一定程度的重合。


3、检验结果;可以发现Kruskal-WallisH检验的检验统计量为2.051,与我们上面手算的结果是相同的。渐近显著性等于0.359,小于0.05,说明三种栖息环境的野鹿数目分布没有显著性差异。结合上方的可视化结果,也能说明印证该分析结果。由于没有显著性差异,因此系统没有进行进一步的多重比较。


所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。生活统计学不仅有各种数据分析方法,更有容易被大家忽视的生活常识。


温馨提示:

  • 生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。

  • 生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。

  • 数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!

  • 数据分析课程私人定制,一对一辅导,添加微信(possitive2)咨询!