专栏名称: 连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
目录
相关文章推荐
笔吧评测室  ·  小米首款 AI PC ... ·  昨天  
笔吧评测室  ·  戴尔全新命名 14/16 Plus ... ·  2 天前  
笔吧评测室  ·  新一代 ROG XG 显卡扩展坞发布:可选 ... ·  3 天前  
笔吧评测室  ·  惠普将推 RTX 5060/5050 ... ·  3 天前  
笔吧评测室  ·  聊一个“知名老品牌”推出的新型笔记本 ·  3 天前  
51好读  ›  专栏  ›  连享会

RDD:断点回归可以加入控制变量吗?

连享会  · 公众号  ·  · 2024-12-17 22:00

正文

👇 连享会 · 推文导航 | www.lianxh.cn

🍓 课程推荐: 连享会:2025 寒假班
嘉宾:连玉君(初级|高级);杨海生(前沿)
时间:2025 年 1 月 13-24 日
咨询:王老师 18903405450(微信)

作者:谭睿鹏 (南京大学)
邮箱:[email protected]

编者按 :本文摘译自以下文献,特此致谢!

Source : Calonico S, Cattaneo M D, Farrell M H, et al. Regression discontinuity designs using covariates[J]. Review of Economics and Statistics, 2019, 101(3): 442-451. -PDF-

温馨提示: 文中链接在微信中无法生效。请点击底部 「阅读原文」 。或直接长按/扫描如下二维码,直达原文:


目录

  • 1. 引言

  • 2. 方法优点

  • 3. 实例应用

  • 4. 参考文献

  • 5. 相关推文



1. 引言

断点回归 (RDD) 由于其依赖的假设较弱,并可以为局部政策效应提供稳健的估计和推断,故被广泛应用于实证研究中。在断点回归中,若使用最小二乘法估计,研究者通常会加入不受政策影响的协变量,如人口统计特征;而使用非参数局部多项式法,研究者大都不考虑协变量,这使得估计量并不总是参数的一致估计。为此,Calonico 等 (2019) 将协变量纳入非参数多项式回归中,以估计局部政策效应,并对相应的统计推断进行了数理论证。

当然,本文的目的是对 Calonico 等 (2019) 方法的具体应用进行介绍。

2. 方法优点

Calonico 等 (2019) 论证了包括协变量以后,非参数多项式回归中估计量的一致性和大样本性质。同时,该方法也具有以下优点:

  • 允许多种形式的协变量进入待估模型,如连续型变量或非连续型变量;
  • 可以使用同样的方法选择关键解释变量和协变量的窗宽;
  • 无需假设协变量进入模型的形式,可以是参数形式,也可以是非参数形式。如果是参数形式,也不需要对函数形式进行假定。

3. 实例应用

接下来,将使用 Calonico 等 (2019) 的方法估计美国 “启智计划” 对儿童死亡率的影响 (Ludwig 和 Miller,2007)。“启智计划” 是美国联邦政府为贫困家庭设立的幼儿园资金项目,该政策于 1965 年向美国 300 个最贫困的县提供了援助。作为向贫困宣战的一种策略,“启智计划” 每年为 90 多万名 3 至 5 岁的贫困儿童、及其家庭提供学前教育、健康和其他方面的社会服务。

其中,实施对象的选择是根据 1960 年的美国县级贫困指数,当该指数在 59.1984 以上时,联邦政府就在该县实施 “启智计划”,反之,则不实施。这里的 59.1984 就是一个很好的断点,学者可以利用该断点设计 RDD,来估计 “启智计划” 的政策效应。

但是,影响儿童死亡率的因素还很多,除 “启智计划” 外,还应包括人口数、黑人比例,城市人口比例,3-5 岁的儿童人口数及占比、14-17 岁的人口数及占比、以及 25 岁以上的人口数及占比。因此,在估计 “启智计划” 对儿童死亡率的影响时,应该控制这些协变量。

在本节,本文将展示标准 RD 和纳入协变量后的 RD 政策效应估计量。需要用到的 Stata 命令为 rdrobust ,安装代码和数据如下:

*命令安装 
ssc install rdrobust, replace // 或链接:http://fmwww.bc.edu/repec/bocode/r/

*数据地址
*https://gitee.com/arlionn/data/raw/master/data01/headstart.dta
*https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/LPZLBF

定义全局暂元:

use headstart.dta, clear 
global y mort_age59_related_postHS // y 为因变量 (儿童死亡率)
global x povrate60 // x 为分配变量 (forcing variable), 美国县级 1960 年贫困指数
global z census1960_pop census1960_pctsch1417 census1960_pctsch534 ///
census1960_pctsch25plus census1960_pop1417 census1960_pop534 ///
census1960_pop25plus census1960_pcturban census1960_pctblack // z 为上文提到的协变量

对于 RD 的点估计和偏差估计可以有不同的窗宽,这里分别用 h 和 b 来表示,在实际操作中可以限制 h = b,也可以不加限制。在统计推断时,可以使用 RD 标准的统计推断方法,也可以使用协变量调整的 RD 统计推断方法。因此,又可以分为以下几种情形进行讨论:

情形一 :对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,RD 标准统计推断方法如下:

rdrobust $y $x, c(59.1968)
global h = e(h_l)
global b = e(b_l)
global IL = e(ci_r_rb) - e(ci_l_rb)

其中, y 为被解释变量, x 为解释变量,c 括号中为分配变量的值,暂元 h 中存储了 RD 点估计时使用的窗宽,暂元 b 中存储了 RD 偏差估计时使用的窗宽,IL 为 95% 置信区间对应的区间长度。


Sharp RD estimates using local polynomial regression.

Cutoff c = 59.1968| Left of c Right of c Number of obs = 2783
-------------------+---------------------- BW type = mserd
Number of obs | 2489 294 Kernel = Triangular
Eff. Number of obs | 234 180 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.809 6.809
BW bias (b) | 10.724 10.724
rho (h/b) | 0.635 0.635

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4102 1.2053 -1.9996 0.046 -4.77264 -.047753
Robust | - - -2.0340 0.042 -5.46284 -.10125
--------------------------------------------------------------------------

可以看出,此时政策效应大小为 -2.41,p 值为 0.042,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为

情形二 :对 h 和 b 间关系不加限制,选择使得未考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) h($h) b($b)

h 为情形一中计算 RD 点估计时使用的窗宽,b 为情形一计算 RD 偏差估计时使用的窗宽。 h($h) b($b) 这两个选项很重要,只有加了它们,才能保证情形二是在情形一的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。

Covariate-adjusted sharp RD estimates using local polynomial regression.

Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779
-------------------+---------------------- BW type = Manual
Number of obs | 2485 294 Kernel = Triangular
Eff. Number of obs | 234 180 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.809 6.809
BW bias (b) | 10.724 10.724
rho (h/b) | 0.635 0.635

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.5073 1.0973 -2.2849 0.022 -4.65808 -.356569
Robust | - - -2.3160 0.021 -5.36613 -.446789
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小为 -2.51,p 值为 0.022,h 值为 6.809,b 值为 10.724,稳健性 95% 置信区间为

情形三 :对 h 和 b 间关系不加限制,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z)

Covariate-adjusted sharp RD estimates using local polynomial regression.

Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779
-------------------+---------------------- BW type = mserd
Number of obs | 2485 294 Kernel = Triangular
Eff. Number of obs | 240 184 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.977 6.977
BW bias (b) | 11.636 11.636
rho (h/b) | 0.600 0.600

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4746 1.0888 -2.2729 0.023 -4.60858 -.340674
Robust | - - -2.2586 0.024 -5.20688 -.368638
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小为 -2.4746,p 值为 0.023,h 值为 6.977,b 值为 11.636,稳健性 95% 置信区间为

情形四 :限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,同时,不加入协变量,RD 标准统计推断方法如下:

rdrobust $y $x, c(59.1968) rho(1)
global h1 = e(h_l)
global b1 = e(b_l)

其中,rho 括号中写 1,表示限制 h 和 b 相同。


Sharp RD estimates using local polynomial regression.

Cutoff c = 59.1968| Left of c Right of c Number of obs = 2783
-------------------+---------------------- BW type = mserd
Number of obs | 2489 294 Kernel = Triangular
Eff. Number of obs | 234 180 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.809 6.809
BW bias (b) | 6.809 6.809
rho (h/b) | 1.000 1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4102 1.2053 -1.9996 0.046 -4.77264 -.047753
Robust | - - -2.7627 0.006 -6.41372 -1.09023
--------------------------------------------------------------------------

如果不加入协变量,但限制 h=b,政策效应大小的估计值为 -2.4102,p 值为 0.046,b 和 h 值均为 6.809,稳健性 95% 置信区间为

情形五 :限制 h=b,选择使得不考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) h($h1) b($b1) rho(1)

其中,h 为情形四中计算 RD 点估计时使用的窗宽,b 为情形四计算 RD 偏差估计时使用的窗宽。 h($h1) b($b1) 这两个选项很重要,只有加了它们,才能保证情形五是在情形四的基础上进行的计算,并且使用了协变量调整的 RD 统计推断方法。


Covariate-adjusted sharp RD estimates using local polynomial regression.

Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779
-------------------+---------------------- BW type = Manual
Number of obs | 2485 294 Kernel = Triangular
Eff. Number of obs | 234 180 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.809 6.809
BW bias (b) | 6.809 6.809
rho (h/b) | 1.000 1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.5073 1.0973 -2.2849 0.022 -4.65808 -.356569
Robust | - - -3.0701 0.002 -6.63546 -1.46441
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9

在限制 h=b 后,政策效应大小的估计值为 -2.5073,p 值为 0.022,b 和 h 值均为 6.809,稳健性 95% 置信区间为

情形六 :限制 h=b,选择使得考虑协变量时,政策估计效应的 MSE 最小化方法来挑选最优窗宽,协变量调整的 RD 统计推断方法如下:

rdrobust $y $x, c(59.1968) covs($z) rho(1)

Covariate-adjusted sharp RD estimates using local polynomial regression.

Cutoff c = 59.1968| Left of c Right of c Number of obs = 2779
-------------------+---------------------- BW type = mserd
Number of obs | 2485 294 Kernel = Triangular
Eff. Number of obs | 240 184 VCE method = NN
Order est. (p) | 1 1
Order bias (q) | 2 2
BW est. (h) | 6.977 6.977
BW bias (b) | 6.977 6.977
rho (h/b) | 1.000 1.000

Outcome: mort_age59_related_postHS. Running variable: povrate60.
--------------------------------------------------------------------------
Method | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+------------------------------------------------------------
Conventional | -2.4746 1.0888 -2.2729 0.023 -4.60858 -.340674
Robust | - - -3.0182 0.003 -6.5421 -1.39074
--------------------------------------------------------------------------
Covariate-adjusted estimates. Additional covariates included: 9

此时,政策效应大小的估计值为 -2.4746,p 值为 0.023,b 和 h 值均为 6.977,稳健性 95% 置信区间为







请到「今天看啥」查看全文