专栏名称: EconPaper
51好读  ›  专栏  ›  EconPaper

断点回归中远离断点的处理效应估计

EconPaper  · 知乎专栏  ·  · 2016-04-25 04:11

正文

断点回归(RD)在是估计处理效应的常用方法。而众所周知的是,RD设计只能估计断点附近的处理效应,而远离断点处的处理效应是不能得到识别的。

然而在一些应用中,虽然有外生的断点可以让我们使用断点回归估计处理效应,然而很多时候我们更关心远离断点处的处理效应,或者平均处理效应(ATE)的大小。

Angrist 和 Rokkanen最近在JASA上的文章《Wanna Get Away? Regression Discontinuity Estimation of Exam School Effects Away From the Cutoff》讨论了在什么情况下,我们可以得到远离断点处的处理效应的估计的问题。


作者通过一个波士顿地区「考试入学」学校是否能提高学生成绩作为例子讨论了这一问题。在波士顿地区有三所考试入学的学校(7-12年级),分别为Boston Latin School (BLS)、Boston Latin Academy (BLA)、O’Bryant High School of Mathematics and Science (O’Bryant)。问题是,通过考试选拔出来加入这些考试入学的学校,真的能够提高学生的成绩么?

在之前的研究(Abdulkadiroglu, Angrist, and Pathak, 2014)中,作者并没有发现十分强有力的证据证明在断点处学生的成绩(用10年级的数学、英语(English Language Arts)成绩度量)有所提高,如下图所示:


(只截取了作者提供的7年级申请入学的图,另有9年级申请入学的结果,横坐标为标准化之后的)

从图上看到,无论是加入O'Bryant还是BLS,似乎对10年级的成绩并没有太大的影响,如果有,O'Bryant对ELA的成绩可能有正的影响。作者的断点回归分析也佐证了这一点:


然而作者提出,很多时候大家并不关心在断点处学生的处理效应,因为那些在断点处的学生可能本来能够从好的学校收获的就不多。作者提出的问题是,如果一个学生本来不能去O'Bryant,他如果去了O'Bryant,成绩会不会有显著提高?以及如果一个能去BLS的学生,只去了一般学校会不会成绩有所降低?也就是说,对于O'Bryant,断点左边的学生的平均处理效应是多少,对于BLS,断点右边的平均处理效应是多少?

为了识别以上的两个处理效应,作者做了一些假设。如果计这几所学校的offer为:

其中r为标准化的测试分数,只有分数高于0才被录取。接下来,作者做了两个假设,首先是条件独立假设(CIA)

也就是说,在控制了一些外生变量x之后,入学考试分数(running variable)对于潜在的结果(10年级成绩)没有任何影响。这个条件是比较强的,幸运的是,这个假设是可以检验的。

另外一个假设则是比较常见的common support假设:

有了CIA假设之后,识别可以通过以下公式得到:

背后的道理是,如果CIA假设成立,而D是完全依赖于running variable r的,因为CIA假设了给定x潜在的结果并不会被r所影响,那么只要知道了未处理组的x与y的关系,这个关系对于处理组也同样适用,就可以通过处理组的x来还原处理组的Y_0,从而得到识别。

所以识别的关键是CIA是否成立?作者提出这个假设是可以被检验的。如何检验呢?CIA意味着如下式子成立:

因而只要检验,对于处理组(非处理组),在控制了x之后,r对Y没有影响(不显著)就可以了。对于作者提出的例子,作者做了一个检验,作者选取了一些学生的人口特征,以及学生在4年级(对于7年级申请者)的成绩、7年级和8年级的成绩(对于9年级的申请者)作为x。也就是说,作者假设在控制了这些学生的人口特征以及之前成绩的情况下,入学考试的成绩对潜在结果没有影响,并做了检验:

可以看到,CIA在9年级申请入学的样本中更可能成立。

那么在CIA成立的条件下,如何进行估计呢?作者提出了两种方法,一种是参数方法,即首先对两组分别估计:

其中x可以包含高阶项等,尽量使用比较flexible的函数形式,然后就可以带入x计算counterfacturals了。

另外,OLS能做的事情,PSM当然也可以做。作者也提出了PSM版本,这里不再赘述了。作者使用这两种方法,分别回答了以上提出的两个问题:

也就是说,如果一个学生没有资格去O'Bryant,一旦去了,在数学和ELA上都有可能有显著的分数提高;而对于去了BLS的学生,如果去一般的学习,似乎成绩也不会有太显著的差别。

最后,作者还讨论了Fuzzy RD下的CIA模型怎么做,这里也不再赘述了。

这个方法的关键是找到一些x使得CIA条件成立(在Fuzzy RD中CIA条件更强一些,也多一些),也就是找到一些x使得running variable对潜在的结果没有影响。在实际应用中,如果项目中的外生变量可以通过CIA的检验,这就大大扩展了RD设计的可用性,而且实行起来非常简单,简单的OLS或者PSM就可以做到,是不是很酷炫呢?