其二,希望诸位能建立起 Stata 的基本架构,熟知 Stata 能做什么、如何做?以便为后续学习打下宽厚扎实的基础。
翻阅 Top 期刊上的论文,文中的方法我们似乎都会。细细想来,原因在于这些论文的想法或视角通常都比较独特,并使用了恰当的方法来论证。这里的关键在于研究设计,而这在目前的计量教科书中却鲜有涉及。为此,本次研讨班突出两个特点:一方面,我会努力把基础知识讲解透彻,进度上不求快;另一方面,我在每个专题中都会提供了 2-3 篇比较经典的论文,展示这些方法的合理应用。
A0-A1 讲 依序介绍 Stata 的基本用法、数据处理、程序编写和可视化分析,学习这些内容无需太多的计量经济学基础,但对于提高实证分析能力和分析效率,大有裨益。本讲中,我会以一篇文章为实例,说明 Stata 的基本语法结构,并对数据处理过程中的关键问题进行介绍,如离群值的处理、文字变量的处理等。就我个人的经验而言,数据处理能力的高低直接决定实证分析的效率,而对于离群值等问题的处理是否妥善会直接影响全文结果的稳健性,是多数人不够重视但却至关重要的问题。此前有不少学完了高级班的同学又回炉初级班,便是感悟到了这一点。
A6. 一篇 Top 期刊论文重现
近期的 Top 期刊越来越强调模型不确定性,比如:控制变量也有好坏之分、是否存在非线性特征、不同模型的优劣对比等。这就需要进行各类检验,以便排除各种「混杂因素」和「似是而非」的论述,让论文的研究结论具有排他性,经济含义也更为清晰明确。本专题包括假设检验的基本原理、模型筛选和对比检验,以及「不容易做好」的稳健性检验等内容。在介绍检验方法和命令的同时,重点在于如何解释它们的经济含义,如何选择合适的检验方法并采用合适的方式加以呈现和分析。在后续的专题中,会结合具体模型设定来讲解这些检验方法的变种的灵活运用。
系数的联合检验:Wald,LR,LM 检验
test, testparm, lincom, nlcom, testnl
R2 分解和贡献度分析
系数差异检验:Chow 检验,SUR,Bootstrap,排序检验
B2. IV 和 GMM (3 小时)
IV 的思想并不复杂,但想找到一个能说服审稿人的 IV 却往往是可遇不可求的事情。在横截面分析中确实如此。随着面板数据模型的快速发展,IV 的构造思路已经发生了很大的变化,「就地取材」、「差别反应」都是非常有用的构造思路。GMM 是估计动态面板的标准方法,它在投资方程、DSGE 等领域也是重要的估计方法。本讲以因果图为基础,介绍 IV,2SLS 和 GMM 的基本思想,辅以几篇经典论文的 Stata 实操。
IV 和 2SLS 估计的原理
GMM 估计的原理
应用 1:动态面板数据模型
应用 2:Lasso-IV
在政策评估中,尤其是「多期政策干预」或「多个处理变量并存」的场景中,我们经常面临遗漏关键变量问题。例如,多期 DID 模型中,不同阶段的政策可能相互影响,而遗漏关键变量会导致政策效果估计存在严重偏误。此时,借助「遗漏变量检验」,我们可以识别那些未被观察到但可能对结果产生重要影响的因素;而「排他性检验」则能够有效避免多个处理变量之间的“污染效应”(如补贴和税收政策的交叉影响),确保每个变量的独立影响被准确估计,如在多阶段政策干预时分离各阶段的政策效应。
Q2. 平行趋势检验与安慰剂检验到底有多关键?如果忽视这些检验,会带来哪些隐患?
平行趋势和安慰剂检验是确保 DID 估计有效的核心。然而,现有的平行趋势检验在应对复杂场景时存在诸多局限,尤其是在面对时间趋势变化(如经济周期)、引入控制变量(如个体特征和环境因素)以及多期政策干预(如分阶段实施的政策)时,容易失效。原因在于,现有方法多以只能事后验证,无法在事前判断是否满足平性趋势假设,这可能导致政策效果估计出现偏误。本课程将引入一些新进提出的平行趋势和安慰剂检验方法,以便在复杂样本(如多群体异质性)和多维数据场景(如多个调节变量和交互效应)中,更精准地识别政策效应,实现更稳健的政策评估。
不变因果预测(Invariant causal prediction)(Kook et al., 2024)
双重有效/双重尖锐(Doubly-Valid/Doubly-Sharp)、敏感性分析(Dorn et al.,2024)
排他性检验(Goldsmith et al.,2022)
Event Study(Freyaldenhoven et al.,2021;Roth,2022)
Treeffuser(Beltran-Velezet al.,2024)
TWFE与标准DID(Wooldridge, 2021)
纽曼正交框架下的DID(包括TWFE,DRDID,DML,GRF, Npcausal)(Sant & Zhao,2020;Kennedy et al.,2023)
匹配框架下的DID(包括:PSM-DID,SDID,WGAN)(Athey et al.,2021)
多期DID(包括:CSDID,动态IPW,RIPW)(Arkhangelsky et al.,2021;Callaway & Sant,2021;Goodman-Bacon,2021;van den Berg & Gerard,2022)
首先,我们将讨论传统遗漏变量检验(Oyster, 2019)以及它在处理因果关系复杂场景中的局限性。Q1.在复杂的政策环境中,如何识别未观测的关键变量?(如教育政策在不同社会经济背景下的差异)。为应对这一挑战,不变因果预测(Invariant Causal Prediction)(Kook et al., 2024)通过在多个环境下寻找因果关系的稳定性,帮助识别可能被忽略的关键变量,特别适用于跨区域政策分析(如跨城市的住房政策)。接着,双重有效/双重尖锐(Doubly-Valid/Doubly-Sharp)敏感性分析模型(Dorn et al., 2024)通过构建双重稳健估计,即使部分模型假设失效,依然能准确估计政策效果。Q2.在模型设定偏差或高维数据中,如何确保估计结果的稳健性?(如公共卫生政策在多个变量干扰下的效果评估)。同时,基于模型辅助的敏感性分析(Tan, 2024)结合了倾向评分和结果均值回归模型,解决了未观测混杂因素带来的偏差问题,适合高维数据和复杂模型的因果推断
此外,针对处理多个政策干预的情境,本专题还将介绍排他性检验(Goldsmith et al., 2022),Q3.在存在多个政策干预时,如何避免变量间的相互污染?(如同时进行的经济刺激政策和税收政策对经济增长的影响)。排他性检验确保多个处理变量独立,从而防止政策效果估计中的交叉干扰,特别适用于多期、多政策场景下的政策分析。
首先,平行趋势假设要求处理组和对照组在政策实施前必须有相同的趋势。Q1.如何做「事后的」平行趋势检验,并确保政策实施前的平行趋势假定成立? 在传统的平行趋势检验中,这一假设通常只做事前检验,但在现实场景中,政策实施前的时间趋势可能具有复杂的动态结构。事件研究法(Event Study)(Freyaldenhoven et al., 2021;Roth, 2022)通过多个时间窗口捕捉政策前后的动态趋势,能够灵活处理多期数据和复杂时间趋势问题。Q2.在存在时间趋势的情况下,平行趋势检验满足时是否就能得到ATT? 事件研究法不仅可以检测不同时间窗口中的政策影响,还可以避免因非线性趋势或数据异质性导致的偏差,提供更精细的政策效果估计。
进一步提升平行趋势检验能力的工具是Treeffuser模型(Beltran-Velez et al., 2024),它通过决策树框架对政策前后的非线性趋势进行建模,特别适用于多维数据和复杂因果关系的场景。Treeffuser在处理多个政策变量时,能够捕捉到变量之间的交互效应并提供更灵活的检验方式,适用于复杂环境下的平行趋势检验。
传统检验方法的可行性分析:逐步检验法、敏感性分析(Imai et al.,2010)、两阶段工具变量法(Di Giuli & Laux,2022)
双重纠偏拉索估计:线性模型(Guo et al.,2022AoS),广义线性模型(Ouyang et al.,2023)
有效中介识别检验(Guo et al.,2022JASA)
因果路径分析(Zhou,2022;Zhou & Yamamoto,2023)
连续型处理变量下的中介效应分析(Lin et al.,2024)
首先,我们将聚焦于调节效应检验。政策效果往往受到不同群体或环境的调节,理解这些调节因素对于准确评估政策效应至关重要。Q1.如何在复杂的高维数据中自动识别出关键的调节变量? 如借鉴Boileau et al.(2024),筛选合适调节变量,进而评估环境政策在不同污染水平下的效果。Q2.在不同调节因素存在时,如何估计其对政策效果的相对重要性? (Chang et al., 2024)比如用于衡量教育政策在不同收入群体中的影响。这些工具将帮助学员在多期政策或多群体异质性背景下,精准评估政策效果的差异性与敏感性。
接下来,Bian et al. (2024)的强化学习方法是本专题的核心内容之一。强化学习通过不断的反馈和数据更新,帮助研究者在复杂的政策环境中做出动态优化决策Q2.如何通过实时数据反馈动态优化政策? (例如,医保政策随着病人健康状况变化而进行的自动调整)。与传统方法不同,强化学习不仅能够适应政策环境中的复杂性(如个体异质性和时间波动),还能够通过学习过程逐步改善政策效果,最大化长期收益。特别是在面对长期实施的政策(如养老金政策)时,强化学习能够根据历史数据实时优化决策,确保政策效果的持续改善。
市场均衡状态下的政策效应评估(Munro et al., 2021)将探讨在存在溢出效应的复杂市场环境中,如何评估政策对个体和整体市场的影响。传统因果推断依赖SUTVA假设,但在现实场景中(如企业投资或地方政府政策)个体之间存在相互影响,无法满足这一假设。Q4.如何在政策影响下估计市场中的直接和间接效应? (如环保政策对企业生产和市场价格的双重影响)。Munro et al. (2023) 提出的模型通过区分直接处理效应(ADE)和间接处理效应(AIE),评估政策对个体自身和其他个体的传导效应,并提出了最优政策目标规则,帮助研究者在保持市场均衡的前提下实现政策优化。本专题将通过实例展示如何在R中实现这一模型。
同时,政策的公平是优化中的另一关键问题。Viviano & Bradic (2023)提出的政策公平性评价模型,帮助研究者在优化政策效果的同时兼顾公平性。Q5.如何确保政策在不同群体间的公平分配? (如税收政策在不同收入群体中的公平性问题)。此外,本专题还将介绍多臂Qini曲线(Sverdrup et al., 2023),为评估和比较不同政策措施的边际效益提供了一种直观有效的工具。通过多臂Qini曲线,研究者可以识别出在特定时间节点或周期内表现最优的政策措施,最大化资源分配效益。
最后,针对连续处理变量(Kennedy et al., 2017;Colangelo & Lee, 2023;Xu & Tan, 2024)的政策优化,本专题将展示如何通过非参数因果推断方法,细化政策效果评估,尤其是在处理变量为连续变量的场景下(如碳税税率或补贴金额)。这些方法将帮助学者在更复杂的政策情境下实现灵活、精准的政策决策。