专栏名称: 计量经济圈
记录一个我们生活在其中的时代社会,囊括的主题如下:经济、社会、世界和计量工具。
目录
相关文章推荐
闹闹每日星运  ·  今生不能错过的队友是TA ·  4 天前  
闹闹每日星运  ·  周运 | 闹闹12星座周运势:0203~0209 ·  4 天前  
闹闹每日星运  ·  相处越久好感度越高的星座 ·  5 天前  
闹闹每日星运  ·  星历0202:巨蟹提高身体素质 ... ·  5 天前  
闹闹每日星运  ·  星历0201:巨蟹拓展好友圈 水瓶适合整理家具 ·  6 天前  
51好读  ›  专栏  ›  计量经济圈

连续型DID也要被改造! 现成的平行趋势PT和TWFE估计都有问题, 时隔3年再次出发!

计量经济圈  · 公众号  ·  · 2024-07-04 11:42

正文

凡是搞计量经济的,都关注这个号了

邮箱: [email protected]

所有计量经济圈方法论 丛的code程序 , 宏微观 数据库和各种软 件都放在社群里.欢迎到计量经济圈社群交流访问 .

除了传统的二元处理双重差分(DiD)模型得到了新的诠释和应用,连续处理的DiD模型也在经济学领域经历了创新性的改造。本文作为一个时隔三年的更新之作,正是这一学术演进的生动例证。

本文深入探讨了连续处理情形下的双重差分(DiD)设计。作者指出,在广义平行趋势假设的条件下,类似于二元处理情形,可以识别出处理对不同处理组类型参数的影响。然而,由于平行趋势假设本身无法完全排除选择偏差的可能性,因此在解释不同处理值之间的参数差异时,面临着特别的挑战。

为了应对这些挑战,本文讨论了一系列可以缓解这一问题但通常较为严格的替代假设。同时,本文还提供了多种处理效应的分解结果,这些结果突出了一个重要现象:即便是在最简单的两期情况下,那些与广泛使用的线性双向固定效应(TWFE)模型相关的参数,也可能难以给出直观的解释。

针对这一问题,本文提出了一种替代的估计程序,该程序不受TWFE模型固有缺陷的影响。在一个具体的应用案例中,本文展示了这些替代估计方法如何可能导致与现有文献不同的结论。

关于连续或强度DID,参看1. 此文的研究发现, 可能会与AER“上山下乡”一样充满争议, 连续DID, 队列DID和Bartik IV ,2. 如何做连续或强度DID? 英文QJE, 中文经济研究2篇文章 ,3. 一篇满足我所有DID幻想的最新AER, 交叠, 连续DID, 调节, 机制分析等范文! 4. 连续DID如何做? 一篇关于土豆的经典文献, 让这一方法在国内外大放异彩 ,5. 连续DID, DDD和比例DID, 不可观测选择偏差 ,6. 欧洲经济学年会最好论文长啥样?学习下强度和队列DID

1 引言

双重差分(DiD)研究设计是一种经典的分析方法,它通过比较处理组和对照组在政策或干预实施前后的结果差异,来评估政策或干预的效果。在传统的DiD研究中,处理通常被视为一个简单的二元状态,即政策存在或不存在。然而,在现实世界中,许多政策或干预措施具有不同的强度或"剂量",例如环境污染的空间分布、地方政府在公共物品和服务上的支出差异,以及学生在校学习时间的长短等。
与二元处理相比,连续处理的优势在于能够评估不同强度的处理对结果的影响。当处理强度与结果之间存在明显的"剂量-反应"关系时,这不仅能够增强因果关系的解释力度,而且有助于检验理论预测。此外,我们往往更关注处理强度变化带来的效果,如资金投入的增加、污染程度的减少或资格范围的扩大,而不仅仅是处理本身的存在与否。
尽管连续DiD设计在理论上具有显著优势,并且在实践中也相当普遍,但现有的计量经济学方法在很多情况下并未提供明确的应用和解释指导。本文旨在介绍一套适用于处理强度变化的DiD设计工具。具体来说,我们将(a)探讨如何利用平行趋势假设来识别不同类型的处理效果参数,(b)分析双向固定效应(TWFE)估计量在何种情况下可能无法提供有吸引力的因果解释(即便其权重为非负值),以及(c)提出具有良好统计特性的非参数估计方法,例如快速的统一收敛速度和较窄的置信区间。我们的研究涵盖了具有不同处理强度或不同处理暴露的DiD设计,但不涉及模糊设计(fuzzy designs)的情况。
在探讨双重差分(DiD)研究设计时,我们首先聚焦于两期的因果参数分析。这种设计模拟了一个单位从无处理状态转变为接受非零剂量处理的情况。首先着眼于这种简单的两期情景,旨在培养直观理解并简化讨论。随后,我们逐步扩展到更为复杂的连续处理情况,以更深入地探讨其设计。
在这种分析框架下,我们将一个单位在特定剂量 ( d ) 下的潜在结果与其在未处理状态下的潜在结果之间的差异定义为水平处理效应。而当剂量发生边际增加时,单位潜在结果的变化则被称为因果反应,这一概念最早由Angrist和Imbens在1995年提出。值得注意的是,当处理状态为二元时,这两种效应的概念是一致的;但在连续处理的情况下,它们则表现出不一致性。
理解水平处理效应与因果反应在解释上可能存在显著差异至关重要,它们需要基于不同的识别假设。类似于二元DiD设计,基于平行趋势的假设,我们可以通过比较处理组与未处理组来识别平均(水平)处理效应参数。然而,如果我们试图通过比较相邻剂量组来识别平均因果反应参数,这在标准的平行趋势假设下是行不通的。
为了克服这一难题,我们提出了一个替代性的假设——强平行趋势假设。根据这一假设,低剂量单位在处理过程中的结果变化,应与高剂量单位在经历相同剂量变化时的结果变化相一致。这种假设有效地限制了处理效应的多样性,为不同剂量组之间的比较提供了坚实的理论支撑。
然而,在没有这一强假设的情况下,虽然剂量组之间的比较能够揭示因果关系,但这种比较会受到一个额外因素的影响。这个额外因素指的是不同剂量组对相同剂量变化产生的不同反应,我们称之为选择偏差。这就意味着,如果没有强平行趋势的约束,我们对因果效应的估计可能会受到其他未观测因素的干扰,从而影响结果的准确性。

接下来,我们将利用识别的结果,对学者在估计连续型双重差分(DiD)设计时最常用的方法进行评估。这种方法是通过运行一种双向固定效应(TWFE)回归模型来实现的,该模型包含了时间固定效应(θt)、单位固定效应(ηi),以及处理后时期的虚拟变量(Postt)与单位i的剂量或处理强度变量Di的交互项:

这种双向固定效应(TWFE)模型的设计,本质上是针对一个基础的双重差分(DiD)研究框架,即涉及两个时间段和两组对象的比较。尽管如此,众多知名教科书如Cameron和Trivedi(2005)、Angrist和Pischke(2008)以及Wooldridge(2010)等,都推崇将其应用于更多样化的研究场景。
在TWFE模型中,参数βtwfe的解读颇为复杂,它涉及多种不同的因果参数解释方法,包括水平效应、缩放的水平效应、因果反应以及缩放的高低效应等。这些解释方法虽然都试图通过剂量特定的因果参数进行加权积分来揭示βtwfe的含义,但在处理效应随剂量或组别变化时,它们往往难以清晰地阐明βtwfe的因果关系和政策含义。
例如,我们发现βtwfe可以表述为平均水平处理效应参数的加权和,但这些权重的总和为零,这意味着我们不能简单地将βtwfe视为平均(水平)处理效应。这一点颇为有趣:在TWFE模型中,对于低于平均剂量的单位,模型赋予了负权重;而对于高于平均剂量的单位,则赋予了正权重。通过利用高低剂量单位之间的剂量差异进行加权平均,实际上相当于在高剂量单位作为“处理”组,低剂量单位作为“对照”组的情况下,进行加权的二元DiD分析,其中权重与单位距离平均剂量的绝对值成比例。
我们还探讨了另一种基于剂量缩放的平均水平处理效应参数的分解方法,尽管其权重的总和为一,但同样显示出了负权重的情况。与此相对,基于平均因果反应参数的TWFE分解具有权重总和为一且非负,但这种分解包含了由于不同剂量间的效应异质性而产生的选择偏差项。幸运的是,强平行趋势假设能够消除这种选择偏差。然而,即便在强平行趋势的条件下,如果存在处理效应的异质性,不同剂量下因果反应的权重与剂量的分布不同,这也为解释βtwfe带来了额外的挑战。这一点在因果效应的大小至关重要时尤为关键,尤其是在具有非线性平均水平处理效应的设置中,平均因果反应在不同剂量分布中可能呈现出不同的符号,从而对分析结果产生显著影响。最终,当我们采用缩放的2×2平均效应作为分析的基础来分解βtwfe时,得出了与前述分析相似的结论。
鉴于现有方法的局限性,我们提出了一种基于识别结果的非参数双重差分(DiD)估计量,旨在恢复具有明确解释性的因果参数。当处理变量是离散的,我们的方法类似于Callaway和Sant’Anna(2021)提出的多阶段DiD请i选哪个,通过运行包含多个处理指示变量的线性回归来实现。而在处理变量是连续的情况下,我们对Chen, Christensen, 和 Kankanala(2023)的方法进行了适当的改进,使其能够将平均水平处理效应和平均因果反应作为剂量的函数进行估计。
这些新工具的优势在于它们受到明确定义的平行趋势假设的驱动,不依赖于严格的函数形式假设,易于实施,并且完全由数据驱动。根据Chen, Christensen, 和 Kankanala(2023)的研究,我们的连续处理DiD估计量在sup-norm下以最快的速率收敛,并且相比于基于欠平滑的方法,我们的统一置信区间更窄(更精确),同时保持了正确的渐近覆盖率。
我们还展示了如何通过使用剂量密度作为权重,构建平均处理效应函数的因果总结度量,巧妙地绕过了TWFE模型中的加权问题。我们的结果表明,通过比较所有接受处理单位的平均结果变化与未处理单位的平均结果变化,可以轻松总结接受处理单位的平均水平处理效应,这一方法由Sun和Shapiro(2022)提出。这可以通过运行一个“处理虚拟变量”等于任意正剂量单位的二元DiD来估计。
使用剂量密度权重来总结平均因果反应,则涉及到估计一个平均导数,这可以通过使用“灵活的”线性回归简单计算得出。此外,我们还讨论了如何利用这些总结度量构建事件研究结果,这些结果可以用来评估平行趋势假设的合理性。
为了直观展示TWFE回归在实际研究中的应用,并阐明我们提出的估计量的优势,重新评估了Acemoglu和Finkelstein在2008年对1983年取消医院劳动补贴的Medicare改革的研究。在原研究中,作者利用TWFE估计量来比较受补贴政策变动影响较大的医院与影响较小的医院在资本-劳动比率上的变化,得出了价格调控显著增加了资本使用的结论。
在这个案例中,区分水平处理效应和因果反应尤为重要。正的水平处理效应表明政策总体上促进了资本使用的增加,而因果反应则揭示了哪个补贴水平产生了最大的响应。我们的分析发现,改革导致资本-劳动比率提升了约18%,这一结果比原TWFE估计高出50%,因为我们的分解方法凸显了TWFE中的加权问题。此外,我们还发现在低补贴水平上存在显著的可变平均因果反应(ACR)参数——这表明替代弹性大于2——但在大多数正剂量下,ACR参数略为负值。
这些负的ACR估计对强平行趋势假设、医院生产的简单两要素模型,或两者都提出了挑战。我们的结果支持Acemoglu和Finkelstein在2008年的结论,即1983年的Medicare改革促使医院更倾向于使用资本而非劳动力。然而,在对哪个补贴水平产生了最大效果的政策解释,或基于生产函数参数的经济解释方面,我们需要持谨慎态度。

相关文献:

本文为现代双重差分(DiD)方法的快速增长文献做出了重要贡献。可以参考Roth, Sant’Anna, Bilinski, 和Poe (2023),de Chaisemartin 和 d’Haultfoeuille (2023),以及Callaway (2023)的综述。这些研究大多集中在二元处理的情形上,但也存在一些例外情况。例如,de Chaisemartin 和 d’Haultfoeuille (2018) 专注于模糊设计,这种设计中,个体层面的二元处理效应被聚合到单位层面,形成一个连续的“处理率”。
与此相对,我们的研究关注的是“清晰”设计,其中处理的暴露在单位层面上是连续的或表现为多值离散。de Chaisemartin 和 d’Haultfoeuille (2020)的补充附录讨论了有序多值处理的情况,并提出了一种使用缩放处理效应度量作为“构建块”的TWFE回归分解方法。我们的分解方法与他们的不同,因为我们允许处理变量是连续的,并且考虑了不同的构建块。这与D’Haultfoeuille, Hoderlein, 和 Sasaki (2023)关于具有连续处理的变化中的变化类型的程序相呼应,其灵感来源于Athey 和 Imbens (2006)的工作。
在我们研究之后,de Chaisemartin, D’Haultfoeuille, Pasquier, 和 Vazquez-Bare (2023) 考虑了具有潜在非分阶段(但静态)处理的连续处理DiD情形。他们的论文与我们的研究解决了相关但不同且互补的问题。例如,他们的目标参数与我们的不同,因为他们考虑的是所说的2 × 2平均效应,这是一种(距离加权)平均值。与我们的可变平均因果反应(ACR)不同,这些参数平均的是离散处理的效果,而不是处理的边际变化。此外,我们的估计程序与他们的有显著差异,因为我们考虑了功能参数(剂量-反应和ACR曲线)和因果总结度量。而他们则考虑了工具变量的扩展,这是我们的研究中没有涉及的。
我们的TWFE分解与近期一些研究结果紧密相关,这些研究探讨了在处理效应存在异质性的情况下,TWFE线性回归的局限性。例如,在我们的一些TWFE分解中出现了负权重,这与二元处理情况下TWFE估计器可能产生的负权重相似(可以参考Goodman-Bacon, 2021;de Chaisemartin和D’Haultfoeuille, 2020;Sun和Abraham, 2021;以及Borusyak, Jaravel, 和 Spiess, 2023的研究成果)。
我们的研究在这一领域增添了新的视角,特别强调同一个TWFE回归系数可能因不同的“构建块”而有不同的解释,并且根据所采用的平行趋势假设的类型,可能会出现新的“偏差”项。尽管我们的研究结果显示,即使在最简单的两期情况下也可能出现负权重,这与前述论文的发现不同,但我们分解中更为重要的发现是,即使所有权重都是非负的,在处理效应存在异质性的情况下,TWFE仍可能提供一个不太理想的因果总结参数。
此外,作为我们分解结果的一个副产品,我们注意到如果将DiD设置转换为具有随机分配剂量的截面数据,这四个分解结果仍然适用(例如,将处理前的结果几乎确定地视为零)。这一点突出了即使在剂量完全随机化的情况下,线性规范在处理连续变量时也可能不是最佳选择。这些发现在现有文献中似乎是首次提出。
为了构建新DiD估计量并进行渐近有效的推断,我们借鉴了Chen, Christensen, 和 Kankanala (2023)的工作,具体可以参考Chen 和 Christensen (2015, 2018)的相关研究。更具体地说,我们将Chen, Christensen, 和 Kankanala (2023)提出的非参数IV数据驱动的sup-norm自适应估计和推断程序调整应用到我们的研究背景中。这种方法使我们能够一次性估计平均水平处理效应和平均因果反应曲线,至少在强平行趋势的假设下是可行的。我们还展示了如何基于这些估计量获得易于解释的总结处理效应度量。我们论文中的这一特色与平均导数的高效估计文献紧密相连,例如Newey和Stoker (1993),Ai和Chen (2007),Chen, Chen, 和Tamer (2023)以及他们引用的文献中的例子。
我们的研究结果不仅在双重差分(DiD)领域内具有重要意义,也与因果推断和计量经济学的其他领域紧密相连。例如,Goldsmith-Pinkham, Sorkin, 和 Swift (2020)在独立性假设的基础上,将Bartik工具与DiD设计相结合。我们的研究通过探讨在不同类型的平行趋势假设下的识别问题,为这一分析提供了补充视角。
我们对不同剂量下平均处理效应(ATTs)的比较持谨慎态度,这反映了在比较“局部”处理效应参数时需要面对的问题。相关研究包括Angrist 和 Fernandez-Val (2013),Mogstad, Santos, 和 Torgovitsky (2018),以及Oreopoulos (2006)在局部平均处理效应(LATEs)背景下的工作;Cattaneo, Titiunik, Vazquez-Bare, 和 Keele (2016)以及Cattaneo, Keele, Titiunik, 和 Vazquez-Bare (2021)在具有多个断点的回归不连续设计中的研究;还有Fricke (2017)在涉及两种处理的DiD背景下的研究。
关于线性回归在近似处理效应方面的局限性的研究结果,与Aronow 和 Samii (2016),Słoczyński (2022a,b),Blandhol, Bonney, Mogstad, 和 Torgovitsky (2022),以及Goldsmith-Pinkham, Hull, 和 Kolesár (2022)的研究相互呼应。特别是,我们对构建块参数重要性的分解结果,与Słoczyński (2022a)的研究紧密相关,后者也探讨了在基于无混杂性的二元截面设计中的相关问题。
最后,我们的因果反应分解基于Yitzhaki (1996, Proposition 2)的理论,该理论将结果对连续变量回归的斜率系数表达为基础局部斜率的加权平均值。除了与因果解释和面板数据相关的差异外,我们还扩展了这些结果,允许未处理单位的存在,为因果推断提供了更广泛的应用场景。
*群友可直接在社群下载全文PDF。
关于多期DID或交叠DID: 1. DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides ,2. 交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误 ,3. 典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了! 4. 最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果!详细解读code! 5. 多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习 ,6. 多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等 ,7. 交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南! 8. 系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码! 9. 标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程 ,10. DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题 ,

Econometrics Circle




数据系列 空间矩阵 | 工企 数据 | PM2.5 | 市场化指数 | CO2数据 | 夜间灯光 | 官员方言 | 微观数据 | 内部数据
计量系列 匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别






请到「今天看啥」查看全文