作者
:王曦池 (中山大学)
邮箱
:[email protected]
温馨提示:
文中链接在微信中无法生效。请点击底部
「阅读原文」
。或直接长按/扫描如下二维码,直达原文:
编者按
:本文主要摘译自下文,特此致谢!
Source
:Valentim V, Núñez A R, Dinas E. Regression discontinuity designs: a hands-on guide for practice[J]. Italian Political Science Review/Rivista Italiana di Scienza Politica, 2021, 51(2): 250-268.
-PDF-
目录
1. 背景介绍
2. 我们为什么需要 RDD?
3. RDD 该怎么做?
3.1 识别 (Identification)
3.2 估计 (Estimation)
4. 实证指南
5. 灵感
5.1 选举胜利的门槛
5.2 固定的议会门槛
5.3 人口阈值
5.4 年龄不连续
5.5 空间上的不连续性
6. 总结
7. 相关推文
1. 背景介绍
Valentim 等 (2021) 为学术界在应用研究中使用 RDD 提供了一个基于直觉、面向实践的指南。本文介绍了 RDD 基本的工作原理,提供了帮助进行稳健性检验的检查表,并简要介绍了一些应用 RDD 的阅读清单,帮助你激发灵感。该指南技术性较低,目的在于为 RDD 初学者提供垫脚石,很适合初学者的快速入门。
2. 我们为什么需要 RDD?
当我们想考察任期对之后的选举结果的影响时,我们该如何做?
直接回归
:你首先可能会想到将之后的选举结果设定为一个虚拟变量,1 表示选举胜利,0 表示选举失败。这样的设定会产生一些问题:那些能获得选举成功的人,可能在能力方面和未获得成功的人有差别,而这些能力方面的差别将同样影响之后的选举结果。
加入控制变量
:接下来,我们很容易想到通过加入控制变量,来解决直接回归导致的问题。但是,现实中总有因素无法度量或观测,我们永远无法自信地说出:自己已观测和控制了所有可能影响选举结果的因素。
将结果随机分配给样本
:从理论上讲,一种可行的方法是抽取政治家的样本,随机赋予其中一半人赢得选举,另一半人输掉选举,然后测量他们在选举中的表现。这种方法可以将所有混杂变量的中心趋势在预期中跨组收敛到相同的值。但在现实中,就像是我们无法对实验对象随机施加暴力一样,这样的做法是不道德、不可行的。
RDD
:前面三种方法都各有缺点,那么面对这类问题,我们该如何研究呢?RDD 或许是一个不错的选择。RDD 是被认为最接近随机实验的检验方法,能够缓解参数估计的内生性问题。
Lee (2001) 使用 RDD 的思路估计在任对连任的影响。进入 21 世纪以来,RDD 在社会科学中越来越常见,每当存在有一个固定的
门槛/分界点
能够划定实验组与对照组时,RDD 就会被考虑使用。和其它方法相比,它具有以下优势:
3. RDD 该怎么做?
RDD 的底层逻辑是:在分界点上,除了我们关心的处理效应 (treatment) 外,没有其他因素 (个人能力、资金等) 会导致结果跳跃。这意味着在分界点两侧,即接近胜选 (但落选) 和恰好胜选的实验对象,是良好的反事实估计。
接下来的例子使用 Dinas 等 (2015) 的原始数据,本例和第一部分提出的问题相似,试图解决在多党制下,小党的议会代表权是否使他们更有可能在随后的选举中取得成功。下图为该例子的图形结果:
下面我们主要从 RDD 的识别和估计两个步骤展示 RDD 过程,最后再简要介绍模糊 RDD 的两阶段。
3.1 识别 (Identification)
3.1.1 基本概念
RDD 所需的唯一假设,要求潜在结果在 treatment 附近连续平滑移动。根据这一假设,发生在不连续点的唯一变化是治疗状态的转变
横轴
:运行变量/配置变量 (running variable),在本例中为政党在
届选举中的得票率。如下图,其中分界线 (cutoff) /门槛 (threshold) 决定了
属于实验组/处理组 (treatment group) 还是对照组 (control group) ,变量值取决于实际得票率与门槛间的距离
纵轴
:结果 (outcome) ,在本例中为政党在
届选举中的得票率。大写字母 (
) 为随机变量,小写字母(
)为实际值。
因果效应
:为两个潜在结果间的差异,是我们在研究中真正关注的效应。
。
我们最多观察到两个潜在结果中的一个。故为了解决这个问题,我们常观察群体层面的影响,即估计和观察以下效果:
3.1.2 识别效应
现在我们知道了 RDD 的一些基本设定,那么,我们如何识别我们期望得到的效应 τ 呢?
由RDD的连续性假设知,潜在结果会在分界点 (c) 区域平稳移动。
回到例子中,我们通过比较刚刚超过选举门槛的政党和刚刚低于门槛的政党,便可以确定进入议会对随后的选举成功的影响:
又因为当
时,我们不能同时观察
和
,故实践中,我们可以实际得出的效应是:
3.2 估计 (Estimation)
当我们识别完成这个效应后,我们又该如何估计这个效应的大小呢?下面我们将从参数估计、非参数估计两个角度估算效应。虽然参数化方法更加直观,但我们更建议大家关注非参数估计。
3.2.1 参数估计 (Parametric estimation)
逻辑:估计当运行变量收敛为零时,函数右极限和左极限之间的差异。下表为式 1-3,我们将逐步改进函数形式,放松潜在假设,得出更完善、通用的 X 与 Y 间的函数关系。
注意
:对于参数估计,我们真正感兴趣的是
,它提供了
时,
对
的影响。
3.2.2 非参数估计 (Non-parametric estimation)
逻辑:对于非线性问题,不用多项式去逼近,而是通过关注分界点左右的小区域,消除非线性的可能性。是一种局部线性回归。对于本文的例子而言,即仅关注在
届选举中,得票率接近分界点 (
) 政党——例如 ±1%。
带宽 (bandwidth):选择观测的范围。对带宽的选择,涉及偏差—方差权衡 (bias-variance tradeoff)。
3.3 模糊 RDD (fuzzy RDD)
到目前为止,我们只考虑了以下情况:用给定的分界点
决定实验组和对照组的划分。但在实际情况中,分界点不总是能确定的分配 treatment or control。例如,在分界点左侧的政党可能属于同一个联盟,而联盟作为整体达到了分界线。故这类政党尽管未能达到分界线 (选举门槛),但还是得到了待遇 (进入议会)。
逻辑:分界点不是确定地分配组别,仅改变成为实验组的概率。高于临界点的进入实验组的概率较高,低于临界点的进入对照组的概率较高。
模糊 RDD 假设:
在分界点影响
的唯一因素是 treatment 的概率变化。
模糊 RDD 的两阶段步骤:
4. 实证指南
4.1 测试清单
接下来,我们将提供一个检查表,并简要介绍其原因、方法和注意事项,帮助使用者们了解他们应该在使用 RDD 中进行的主要稳健性检查。
绘制出与阈值距离有关的分布条件
:绘制原始数据已逐渐成为 RDD 中的标准做法。帮助直观的感觉到分界点周围的不连续性。
方法:在
轴上画出因变量的局部平均数与
轴上的运行变量的对比图,同时在
轴的分界点两侧画出拟合线。Calonico 等 (2015) 开发的
rdrobust
软件包,可以轻松绘制上述图像。
注意:(1) 采用灵活的回归模型 (多项式),(2) 注意选择统计堆 (bin) 的大小。
注重非参数模型
:参数估计使用全样本,对远离分界点的观测值给予了过多的权重,可能使估计结果产生较大噪声(Gelman 和 Imbens,2019)。
显示使用不同带宽的结果
:理想情况下,估计系数值不会受带宽的影响 (但可能损失统计精度)。报告一个有大量带宽的图(集中在最佳带宽附近的 0.5-2 倍)。具体来说,可以在
轴上报告带宽,在
轴上报告 LATE,以及置信区间。
进行操纵测试
:由于发生了自我选择,使存在操纵行为 (manipulation)。导致不能再假设围绕阈值“跳跃”的唯一东西是概率。这会混淆人们感兴趣的估计关系。方法包括 (1) 对分类的初步检验 (McCrary,2008);(2) 使用 RDD 包实现 (推荐)。
使用安慰剂结果进行重复分析
:RDD 要满足连续性假设,研究者应使用安慰剂检验证明 (至少) 重要观察变量不会出现不连续。方法是用这些观察变量取代结果变量。
使用安慰剂分界点进行重复分析
:根据连续性假设,除了阈值附近的变量外,结果变量不应出现跳跃。进行多次安慰剂阈值测试,可增强结果的可信度。方法使用实际阈值以外分界点来重复分析。
效果的异质性需要谨慎对待
:通常面对异质性,会使用交互项解决问题。但是在 RDD 中,这种方法不再奏效,甚至会导致严重的过度预测问题。方法包括:(1) 依照 Abadie (2005) 中的倾向得分加权法;(2) Gerardino 等 (2017)、Hsu 和 Shen (2019) 提供了一个 Stata 软件包
rddsga
。
4.2 软件工具
对于参数化估计,不需要使用特定的软件包,其研究思路沿袭 OLS 回归。
对于非参数化估计,常使用软件包
rdrobust
实现。
主要命令为
rdrobust
,可输出常规 (conventional)、偏差校正 (bias-corrected)、稳健 (robust) 这三种结果;
命令
rdensity
,估计断点附近样本单位的密度;
选项
fuzzy
,可将默认的清晰 RDD 调节为模糊 RDD。
5. 灵感
这一部分将提供了 5 个使用 RDD 的经典场景,每个场景中又将分为不同的研究方向。我们将简要分析每种场景中使用 RDD 设计的背后逻辑,并介绍一些使用这种设计来回答不同研究问题的论文。
5.1 选举胜利的门槛
逻辑:政治学中最常用的 RD 设计之一是由选举结果产生的不连续性。某一政党的得票率是连续的,研究人员可以利用选举胜利门槛 (通常是 50% 的选票) 附近的跳跃来估计这种胜利对感兴趣结果的影响。
研究方向1:在职优势的影响
Lee (2001)
研究了在职优势的影响,由于选举胜利可能受到其他因素的影响,故本文使用 RDD,通过利用狭义选举胜利产生的不连续性克服内服内生性问题。
Trounstine (2011)
表明,在职优势也延伸到了美国地方政治。
Butler (2009)
表明,在职优势对于非新生代的在职者比新生代的在职者更明显。
Hainmueller 和 Kern (2008)
研究了全球其他地区的效果,表明在职者在混合制度中具有溢出效应——具体来说就是德国的制度。
Uppal (2009)
在印度国家立法选举中发现了相反的效果。在职者在保证其连任时,似乎实际上处于不利地位。
研究方向2:选举胜利对政治精英行为的影响
Thompson (2020)
研究了地方一级的执法是否因执政党的不同而不同。在特朗普政府下,作者在包含 3200 多个党派治安官选举和治安官行为行政数据的新数据集中使用 RDD,研究了遵守联邦要求拘留未经授权的移民的效果,没有发现证据表明民主党的警长比共和党的警长更不可能遵守。
Ruipérez Núñez 和 Dinas (2020)
公共记忆场所在后威权主义西班牙的政治用途。使用 RDD 在 16 年内分析了 5500 个城市后发现,右派以微弱优势获胜的城市更有可能保留暗指右翼独裁者佛朗哥的街道名称,而左派以微弱优势获胜的城市则更有可能删除这些名称。
Huidobro和Falcó-Gimenez (2020) 利用这一设计表明,在西班牙的市政选举中,女性和年轻领导人以微弱优势获胜,被任命为市长的可能性明显低于男性和年长的同行。
研究方向3:担任职务的货币和非货币回报
Eggers 和 Hainmueller (2009)
表明担任公职会对财富产生重大影响。应用匹配和 RDD 将国会议员 (MP) 与以微弱优势失败的议会候选人进行比较,发现在选举中险胜成为英国国会议员的保守党国会议员的财富几乎翻倍,但工党国会议员没有发现这种影响。进一步的研究表明,担任公职也有非金钱上的好处。
Barfort 和 Klemmensen (2017)
分析了政治职位对候选人健康的影响。使用 RDD 利用战后美国州长竞选的数据,表明担任公职会使人的预期寿命增加约 5 年。
Lee 等 (2004)
发现没有证据表明对候选人的选举支持力度会影响其政策的温和性。
Benedictis-Kessner 和 Warshaw (2016)
发现,狭义的民主选举市长会增加该市的支出。
按照类似的思路,
Benedictis Kessner 和 Warshaw (2020)
发现,狭义的民主党立法者当选为美国总统,会增加该市的支出。县级政府的公共开支增加 5%。
5.2 固定的议会门槛
逻辑:世界上许多国家都有法律规定的选举门槛,只有跨过这些门槛的政党才能获得议会代表权。这些门槛带来了一个政党进入议会的概率的“跳跃”,研究人员可以利用它来估计议会代表制对一些感兴趣的结果的影响。
研究方向1:跨过选举门槛对之后政治成功的影响