专栏名称: 生活统计学
平台致力于将统计学基础与生活实例联系起来,带大家走进生活统计学的世界。介绍统计软件SPSS/SAS/Minitab的生活统计运用技巧。
目录
相关文章推荐
药明康德  ·  默沙东研发疫苗有望在欧盟获批上市 ·  3 天前  
医药经济报  ·  医药经济专家谈 | ... ·  3 天前  
医药经济报  ·  小分子药领衔多点开花 ·  5 天前  
医药经济报  ·  医药经济专家谈 | ... ·  5 天前  
药明康德  ·  病毒载量下降近90%!创新RSV口服疗法临床 ... ·  6 天前  
51好读  ›  专栏  ›  生活统计学

SPSS分析技术:Eta系数的原理及其运用

生活统计学  · 公众号  ·  · 2019-05-09 23:58

正文

基础准备

前面草堂君介绍了适用于两个定类型变量、一个定类型和一个定序型变量、两个定序型变量的相关系数,以及如何使用SPSS软件对它们进行计算,大家可以点击下方文章链接回顾:


今天草堂君继续介绍适用于一个定距型变量和一个分类型(定类或定序)变量的相关系数:Eta系数和ω2(Omega-Squared)系数,SPSS软件可以计算Eta系数,ω2系数需要大家根据方差分析的结果自己计算。


一个定距变量和一个分类变量

对于定距型变量作为因变量,分类型变量(定类和定序)作为自变量,表示两者之间的关系,跟着草堂君学习过统计基础的朋友应该知道,可以使用单因素方差分析,以确定自变量的不同水平对应的因变量平均值是否存在显著性差异。如果存在显著性差异,换句话说,也就是自变量(分类型)和因变量(定距型)存在相关关系。

 

虽然方差分析结果能告诉分析者自变量不同水平对应的因变量平均值是否存在显著性差异(自变量和因变量是否存在相关关系),但是并不能告诉分析者这种相关关系有多强。举个例子说明:测试不同使用剂量下,某种止疼药的止疼效果是否曾在显著性差异,进行4个剂量的测试,每个剂量组随机选择8个情况相似的志愿者,实验结果如下,表格中的数值代表志愿者反馈的,使用了相应剂量止疼药后,疼痛降低的分数(总分100分)。


这个案例涉及两个变量:因变量是疼痛降低分数(定距),自变量是止疼药的使用剂量(定类)。使用单因素方差分析(操作过程可以回顾文章:SPSS分析技术:单因素方差分析结果的模型解读),可以得到如下结果:

显著性p值等于0.001,小于0.05,说明不同止疼药的剂量下,志愿者的平均疼痛降低分数之间存在显著性差异。这个结果换个说法就是止疼药的使用剂量和疼痛降低分数之间存在相关关系。这个相关关系的强度到底是多少呢?Eta系数可以表示它们之间的相关强度。


Eta系数

Eta系数也称为比例相关系数,这个名称来源于它的计算公式,用组间方差除以总方差的平方根表示,计算公式如下所示:


从Eta系数和Eta平方系数的计算公式可知,Eta系数表示自变量能够解释因变量变化的方差占因变量总变异方差的比例,这个比例越高,代表自变量对因变量的解释能力越强,自变量与因变量的相关关系越强。此外,Eta系数是一种可以表示非线性相关的相关系数,如果自变量与因变量是线性相关,那么Eta系数与皮尔森相关系数是相等的,这部分内容会在后面详细介绍。将上面案例的结果代入Eta和Eta平方系数,可以得到如下结果:


从计算结果可知,Eta系数达到0.647,大于0.5,表示止疼药的使用剂量与止疼效果(疼痛降低分数)之间存在较强的相关关系。Eta平方表示止疼药的使用剂量能够介绍疼痛降低分数总变化量的41.9%。


案例分析

将上面介绍的案例数据整理进入SPSS,如下图所示。Dose代表止疼药的使用剂量等级,而pans代表疼痛降低分数。


分析步骤

1、选择菜单【分析】-【描述统计】-【交叉表】,将疼痛降低分数选为行变量,将使用剂量选为列变量。一般情况下,因变量作为行变量,自变量作为列变量。

2、点击确定,输出结果。


结果解释

结果如下图所示,SPSS输出了疼痛降低分数作为因变量和药物剂量作为因变量的Eta系数值,这里我们去疼痛降低分数作为因变量的Eta值为0.647,这与我们上面手动计算的结果相同。表明疼痛降低与止疼药使用剂量之间具有比较强的相关关系。


此外,草堂君还选择性的输出皮尔逊相关系数为0.516,皮尔逊相关也就是我们之前介绍过的,用来表示线性相关关系强弱的相关系数。0.516小于Eta系数0.647,说明药物剂量和疼痛降低之间的相关关系为非线性相关,在建模时可以考虑引入多项式。这部分内容,将会在后面的实验设计文章中具体介绍。


总结一下

从Eta系数的计算公式和分析原理可知,Eta系数其实是单因素方差分析结果的一种有力补充。单因素方差分析只能告诉分析者自变量各个水平对应的因变量平均值是否存在显著性差异。虽然分析结果如果存在显著性差异,可以推断出两个变量(一个定距和一个分类)之间存在相关关系,但是相关强度大小以及是否线性相关是无法量化和推断的,因此Eta系数能够很好的弥补单因素方差分析这方面的缺陷。


公众号的文章都是一文一例,所有例题的数据文件及SPSS软件都已上传到QQ群(群号:577312904),需要对照练习数据分析技术的朋友可以前往下载。


温馨提示: