专栏名称: 连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
目录
相关文章推荐
河北交通广播  ·  【992 | ... ·  昨天  
河北交通广播  ·  【992 | ... ·  昨天  
河北交通广播  ·  【992 | ... ·  昨天  
河北交通广播  ·  范县凌晨突发地震!网友:被震醒了… ·  昨天  
Excel之家ExcelHome  ·  AI时代Excel会被淘汰?LOOKUP函数 ... ·  4 天前  
51好读  ›  专栏  ›  连享会

论文推介:包含连续处理变量的 DID

连享会  · 公众号  ·  · 2025-01-09 22:00

正文

👇 连享会 · 推文导航 | www.lianxh.cn

🍓 课程推荐: 连享会:2025 寒假班
嘉宾:连玉君(初级|高级);杨海生(前沿)
时间:2025 年 1 月 13-24 日
咨询:王老师 18903405450(微信)

温馨提示: 文中链接在微信中无法生效。请点击底部 「阅读原文」 。或直接长按/扫描如下二维码,直达原文:

作者 :李萌 (武汉大学)
邮箱 [email protected]

编者按 :本文主要摘译自下文,特此致谢!
Source :Callaway, B., Goodman-Bacon, A., & Sant’anna, P. H. (2024). Difference-in-differences with a Continuous Treatment. National Bureau of Economic Research. -Link- -PDF- -Google-

1. 引言

经典的双重差分 (DID) 研究设计通过比较处理组和对照组在处理前后的结果来评估处理效果。然而,在许多 DID 应用中,处理效应并非是二元的,即要么受处理,要么未受处理,而是具有“剂量”或以不同强度运行。

连续处理效应 相较于二元处理效应,提供了更多的分析优势。通过观测结果和处理强度之间明确的“强度-反应”关系可以支持因果解释或检验理论预测。此外,研究者通常更关注处理强度变化带来的影响,如资金增加、污染减少或资格范围扩大,而不仅仅是处理措施存在与否的影响。

尽管连续 DID 设计在理论和实践中都具有重要价值,但鲜有的计量经济学研究在如何应用和解释这类设计方面提供的帮助有限。对此,本文介绍了一套适用于具有连续处理变量的 DID 设定的新工具,有助于提高因果推断的准确性和可靠性。

2. 实证视角下连续DID设计的应用动机

为了更具体地阐释我们的理论成果,并为我们的分析提供更直观的理解,本文回顾了 Acemoglu 和 Finkelstein  (2008) (下文简称 AF) 有关价格管制对企业投入决策的影响研究。具体而言:

1965 年,美国医疗保险开始实施时,医院根据医保受益人占患者总住院天数的比例 ( ),从联邦政府获得部分劳动力和资本支出的报销。此时,医院 面临的劳动力投入价格为 ,资本投入价格为 。其中, 分别为劳动力和资本的补贴率, 分别为市场工资和租金率。

1983年,美国医疗保险改革,转变为预期支付系统 (PPS),用每次就诊/诊断的小额支付代替了以往的劳动力补贴。使得 ,而资本补贴保持不变。因此,某医院的劳动力价格从 上升到 ,扭曲了相对要素价格。

在这一场景下,医院的医疗保险规模 与其劳动力价格变化 之间的法定关系,促使 AF 采用了连续 DID 设计,以比较在 pre-PPS 时期拥有不同医保住院病人份额的医院在 1983 年前后的资本/劳动力比例变化。

应用这种连续DID的动机主要包括以下三点

  • 第一,强度大小 (或暴露程度) 的变化使得评估那些对于二元 DID 设计而言不可行或不理想的处理效应成为可能。在 AF 的案例中,医院的医疗保险规模 的均值为 0.45,标准差为 0.15,且相较于未受政策影响的医院, 的医院之间更具可比性。
  • 第二,暴露程度与结果之间的“强度-反应”关系可以支持因果解释或检验理论预测。AF 在其研究中提出了一个简单的理论框架,其中 PPS 的转变应当:(1) 提高资本/劳动力比率,(2) 对 PPS 前 值较高的医院影响更大。AF 将连续性 DID 设计视为一种估计 PPS 整体因果效应并检验模型的理论预测的方法。
  • 第三,连续 DID 设计可以用来估计强度 (或暴露程度) 的较小变化所产生的平均因果效应。在许多经济模型中,价格和收入弹性决定了税率、税基、补贴和法规等的最优政策 (Hendren,2016),这些连续概念只有通过连续变化才能得到准确估计。

3. 基准案例:两时期的新处理效应

我们首先通过两时期面板数据的设定来阐释主要观点, 。在第二时期 ( ),一些单元接受处理,记为 ,而其他单元则保持未受处理状态, 的支持表示为 可以是 (绝对) 连续的,也可以是多值离散的。我们将单元 在时期 的潜在结果定义为 ,即单元 在时期 接受处理强度 时所经历的结果。在每个时期 中,单元 的观测结果为 。我们假设所有期望都是有限且定义明确的。为了简化符号,后文中我们将省略单元索引 ,并定义

3.1 连续处理效应下的关键参数

潜在结果 表明处理效应可以有多种取值,因此每个单元可以经历多种类型的因果效应。给定单元在时期 接受处理强度 ( ) 的 水平处理效应 ,即 水平处理效应 衡量了在时期 中处理强度由 变为 时的处理效应。这一概念是将二元处理效应直接扩展至连续处理效应函数或“强度-反应”函数。

我们将单元在 处的 因果反应 定义为 ,即潜在结果关于强度 的导数 (当处理效应连续时),或者为 ,即相邻强度之间的潜在结果差异 (当处理效应离散时)。 因果反应 衡量了在时期 ( ) 中处理强度为 ( ) 时的边际增量的处理效应。

我们关注的是在处理后期,即 时,这两种因果效应的均值。此时, 平均水平处理效应 (我们通常称之为平均处理效应) 由二元情况下拓展为:

其中, 为处理后期 时,在处理条件 下,处理强度 相对于处理强度 的平均效应。当 时,这表示接受处理强度 的单元的 时,在所有单元中(不仅仅是实际接受处理的单元)接受处理强度 的潜在结果相对于未接受处理的潜在结果的平均差异。

  • 当处理效应为绝对连续时,平均因果反应的参数定义为
  • 当处理效应为多值离散时,平均因果反应的参数定义为

上图直观展示了连续 DID 设计中的因果参数。图中凹线为 ,即实际接受处理强度为 的单元,在各种处理强度下的平均处理效应函数。当考虑两种处理强度 时, 为曲线的高度,即平均处理效应。当处理效应为绝对连续时, 为曲线的切线斜率。当处理效应为多值离散时, 参数为连接函数两点的线的斜率。

上述函数参数的加总形式为:

3.2 连续处理效应下的识别

为了讨论平均处理效应和平均因果反应参数的识别,我们提出如下假设。

假设1 (随机抽样) :观测到的数据由 构成,且独立同分布。

假设2 (连续或多值离散的处理效应) :在 期,没有单元接受处理,在 期,处理强度 的支持为 ,且为连续或多值离散的。更准确来说,以下之一为真:

  • (a) ,其中 ,且满足 ,对于某个 。此外, 是一个勒贝格密度,存在正常数 ,使得对于所有 ,满足 ,且 上连续可微。
  • (b) ,其中 ,且满足 ,对于某个 。此外,对于所有 ,有

假设3 (无预期和观测到的结果) :对于所有单元和所有

假设 1 表示我们观察到两个时期的独立同分布面板数据。假设 2 规范化了在任意时期都未接受处理的单元,其余单元则接受连续形式的处理 (2a) 或离散形式的处理 (2b)。假设 3 表示任何单元均不存在预期的处理效应,因此在第一时期我们观察到所有单元的未受处理潜在结果,而在第二时期则观察到单元 实际接受的处理强度的潜在结果。

在连续 DID 设计中,平均水平处理效应的识别与二元处理效应 DID 的设定紧密相关,其结果依赖于对二元情况下平行趋势的拓展。

假设4 (平行趋势) :对于所有

假设 4 表示,接受处理强度 的单元在未接受处理的情况下的平均结果趋势与未受处理的单元实际经历的结果趋势相同。简而言之,我们通常将假设4称之为平行趋势 (PT)。

定理1 :在假设 1 至 4 下, 对于所有 是可识别的,表示为:

进一步地,

定理 1 中 的识别结果基本与二元处理效应的情况下相同,但假设 4 定义的平行趋势不足以保证 的识别,这一问题在二元处理效应的设定中也存在。

定理2 :在假设 1 至 4 下,因果反应参数不可识别,具体而言:

  • (a) 在假设 2(a) 下,对于所有
  • (b) 对于

当假设 2(b) 成立时,取 ,则

定理 2 表明,即使在平行趋势假设下,未受处理的潜在结果以相同方式演变,实际观测到的不同处理强度组之间的结果差异也会来源于两个方面:一个是因果反应本身,来源于处理强度的差异 ( );另一个是选择偏误,来源于不同强度组接受相同强度的处理时平均处理效应的差异。

上图以两个组别和两个离散处理强度 ( ) 为例,展示了这些识别结果。我们可以看出,连接点 的直线斜率比我们关注的平均因果反应斜率 更陡。这是因为该直线在不同的 函数之间存在跳跃,这种现象被选择偏误所影响,表现为在较低处理强度 下处理效应的差异,即 。在这种情况下,由于低强度组 的观测结果不能有效地作为高强度组 在低强度下的反事实结果,同时我们也无法观察到高强度组 的结果 ,因此选择偏误无法被识别,导致因果解释面临困难。

假设5 (强平行趋势) :对于所有

假设 5 显著异于假设 4,因为它涉及了不同处理强度下的潜在结果 ,而不仅仅是未受处理的潜在结果 ,。,需要说明的是,我们提出假设 5 的目的是为了说明连续 DID 的参数识别需要施加比假设4定义的平行趋势更强的假设,而非要求研究中在应用中采纳。事实上,在许多应用中,它可能是一个很强或者并不合理的假设。

定理3 :若假设 1 至 3 和假设 5 成立,则

  • (a) 对于所有
  • (b) 当假设 2(a) 成立时 (即处理效应是连续的),对于所有
  • (c) 对于

当假设 2(b) 成立时 (即处理效应是离散的),取

3.3 双向固定效应估计的参数

在实际应用中,研究者通常使用双向固定效应 (TWFE) 回归来估计连续 DID 的参数:

其中, 分别为时间固定效应和单元固定效应, 衡量了单元 的处理强度, 代表处理时期的虚拟变量。

实证研究者通常以三种方式来解释参数 。:

  1. 直接解释为因果反应参数,即当处理强度增加 1 个单位,结果因此平均增加多少。
  2. 选取一个代表性的 值,汇报 ,并将这个数值解释为 。在这种解释下, ,即将 与标准化的水平效应联系起来。
  3. 选取两个不同的 值,通常为处理强度的上下四分位数,并将 解释为处理强度由 变为 的平均因果反应,即为一个标准化的 效应。

在假设 4 (平行趋势) 和假设 5 (强平行趋势) 下,我们参考上表所示的 TWFE 权重对 进行分解。

定理4 :若假设 1,2(a),3 和 4 成立,则

  • (a) 因果反应分解:

其中,权重始终为正且积分为 1。

  • (b) 水平分解:

其中,对于

  • (c) 标准化的水平分解:

其中,对于

  • (d) 标准化的 分解:

其中,权重 始终为正且积分为 1。

如果用假设 5 代替假设4,那么 (a) – (d) 中的选择偏误将为 0,且分解项的其他部分保持为真,同时(a)中的 将替换为 ,(b)、(c) 和 (d) 中的 将替换为 ,将 (d) 中的 替换为

定理 4(a) 表明,在假设 4 下, 等于 和定理 2 中选择偏误的加权平均,权重始终为正且积分为1。定理 4(b) 表明,在平行趋势下, 等于 的加权积分,权重积分为 0,因此存在部分负权重。定理 4(c) 表明,在与 (b) 相同的条件下, 也存在负权重,即使权重积分为 1。定理 4(d) 表明,在平行趋势下, 的权重始终为正且积分为 1,但将因果效应和选择偏误混合在了一起。

小结 :当参数为水平效应时 (如 (b) 和 (c)), 不会被选择偏误影响,但存在负权重。当参数涉及不同处理强度的比较时 (如 (a) 和 (d)), 不存在负权重,但会包含选择偏误。

4. 能突出或总结异质性的DID估计量

为了克服 TWFE 估计的限制,我们提出了一个数据驱动的估计程序,这个程序适用于定义明确的因果参数,并且不受限于参数的函数形式。

4.1 平均因果函数的非参数估计

当处理效应为多值离散时 ,处理效应的异质性相对简单,可以通过比较均值来实现。具体而言,只需要将未受处理的单元省略,对结果变化和一组饱和的处理强度指标进行回归:

在平行趋势假设 (PT) 下,OLS 的回归系数 的估计量。在强平行趋势假设 (SPT) 下,







请到「今天看啥」查看全文