专栏名称: 爱数据原统计网
中国统计网(www.itongji.cn),国内最大的数据分析门户网站。提供数据分析行业资讯,统计百科知识、数据分析、商业智能(BI)、数据挖掘技术,Excel、SPSS、SAS、R等数据分析软件等在线学习平台。
目录
相关文章推荐
51好读  ›  专栏  ›  爱数据原统计网

详细讲解——倾向评分法

爱数据原统计网  · 公众号  · BI  · 2017-01-13 17:16

正文


01

倾向评分的提出背景


观察性研究中,以队列研究为例,暴露因素的分配(如是否吸烟)通常不受人为控制,暴露组和非暴露组的形成无法等同于随机分组,因此很难做到研究对象在组间均衡可比



组间因素不均衡可能造成混杂。调整混杂因素,可针对混杂因素进行匹配、分层分析或协变量调整等。但这些方法控制的混杂因素都不能太多。


当混杂因素较多时可采用倾向评分法(Propensity Score Method)。


02

倾向评分的原理


以吸烟-肺癌的队列研究为例,自然状态下个体是否吸烟与很多因素有关,并不是随机的,吸烟组和非吸烟组会有多个基线特征不平衡。


那么,倾向评分如何解决这个问题呢?


图中椭圆代表个体,数字代表成为吸烟者的概率


如图,计算研究对象在多种背景因素(如年龄、性别等与是否吸烟有关的因素)下成为吸烟者的概率(即倾向评分),匹配概率相等或相近的个体,组成新的吸烟组和不吸烟组,此两组可近似为随机分组,组间相关因素可达到均衡。


由此,组间分配不均衡的多个变量,被“倾向评分”一个综合指标所代替,达到了“降维”的效果。除采用匹配法外也可把倾向评分作为协变量进行调整。


03

倾向评分的应用


倾向评分控制混杂的方法主要有倾向评分匹配、分层、回归调整和加权标化。


倾向评分匹配,就是依据倾向评分大小进行配对。以下介绍最常用的倾向评分最近法:


倾向评分最近法(nearest available matching on the estimated propensity score):先规定一个界限(文献里称为Caliper),如


04

举例


某医院欲随访研究妇女孕期先兆子痫(PE)对儿童某些发育状况的影响[1]。该研究包括187名先兆子痫妇女和4722名正常妇女。研究者欲选出可比的正常妇女进行研究。配比前后各基线数据如下表:


倾向评分最近法配比前后人群主要特征的分布



从表中可以看出,配比前各基线因素相差较大,而配比后较为均衡。


尽管倾向评分配比能够同时平衡较多的变量,但只能局限于已知的混杂变量,而一些未知的混杂变量可能仍然会对最终的结果产生影响。因此,其混杂因素的均衡能力不可能完全达到随机对照研究的水平。


End.


作者:大仙儿(中国统计网特邀认证作者)


本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:itongjilove),转载时请注明作者及出处,并保留本文链接。