缺乏实验数据的计量经济学识别方法往往需要建立在外生性假定基础之上。也就是说,
x
对
y
的影响与误差项
u
不相关。在外生变量直接导致被解释变量变化的情况下,回归识别因果效应才是充分有效的。
在上述例子中,显然,不能简单地将
y
(GPA、出勤率、毕业率等)的变化归结为政府奖金的功劳,因为那些收到奖金和未收到奖金的学生存在多方面差异。然而,由于确认资格的收入分界线是未知的,在断点两侧小邻域内的个体可以被视为是相同的。因此,我们有理由认为未知的收入线外生随机地将断点附近的个体分成了两组,一组收到了政府奖金,一组未收到。
2. 模拟生成非线性相关数据
这里,我们假设被解释变量与收入的关系是非线性的 (线性相关性的举例和分析可以参见
Sharp Regression Discontinuity Example and Limitations
)。Stata 随机生成一些非线性相关的自变量收入
income
和因变量学习表现
perfo
并绘制二者散点关系图。
温馨提示:
文中链接在微信中无法生效。请点击底部
「阅读原文」
。
clear set obs 10000
gen income=3^((runiform()-0.75)*4) label var income "Reported Income"
sum income Variable | Obs Mean Std. Dev. Min Max -------------+--------------------------------------------------------- income | 10,000 .6789349 .7606786 .0370671 2.999232
gen perfo=ln(income)+sin((income-r(min))/r(max)*4*_pi)/3+3 label var perfo "Performance Index - Base"
scatter perfo income
下图展示了自变量与因变量的非线性关系:
现在,让我们加入一些随机扰动。
gen perf1=perfo+rnormal()*0.5 label var perf1 "Performance Index - with noise"
Variable | Obs Mean Std. Dev. Min Max -------------+--------------------------------------------------------- grant | 10,000 .5921 .491469 0 1
*样本中大约有59%低收入学生是具备获得政府奖金资格的 *现在加入政府奖金对学生表现的正向效应 *首先生成以政府奖金资格确认收入线为中心的收入变量 gen income_center=income-0.5 gen perf2=perf1+0.5*grant-0.1*income_center*grant *这样政府奖金对低收入学生将更加有效 label var perf2 "Observed Performance"
image
3. 进行非参数估计
首先,让我们尝试使用传统的普通最小二乘回归。
reg perf2 income grant
Source | SS df MS Number of obs = 10,000 -------------+---------------------------------- F(2, 9997) = 5734.77 Model | 7041.8845 2 3520.94225 Prob > F = 0.0000 Residual | 6137.80314 9,997 .613964504 R-squared = 0.5343 -------------+---------------------------------- Adj R-squared = 0.5342 Total | 13179.6876 9,999 1.31810057 Root MSE = .78356
Sharp RD estimates using local polynomial regression.
Cutoff c = 0 | Left of c Right of c Number of obs = 10000 -------------------+---------------------- BW type = mserd Number of obs | 5921 4079 Kernel = Triangular Eff. Number of obs | 683 530 VCE method = NN Order est. (p) | 1 1 Order bias (q) | 2 2 BW est. (h) | 0.129 0.129 BW bias (b) | 0.197 0.197 rho (h/b) | 0.652 0.652
gen nincome_center=income_center*(-1) rdrobust perf2 nincome_center
Sharp RD estimates using local polynomial regression.
Cutoff c = 0 | Left of c Right of c Number of obs = 10000 -------------------+---------------------- BW type = mserd Number of obs | 4079 5921 Kernel = Triangular Eff. Number of obs | 530 683 VCE method = NN Order est. (p) | 1 1 Order bias (q) | 2 2 BW est. (h) | 0.129 0.129 BW bias (b) | 0.197 0.197 rho (h/b) | 0.652 0.652
2.
Calonico S, Cattaneo M D, Farrell M H, et al. rdrobust: Software for regression-discontinuity designs[J]. The Stata Journal, 2017, 17(2): 372-404.PDF