其二,希望诸位能建立起 Stata 的基本架构,熟知 Stata 能做什么、如何做?以便为后续学习打下宽厚扎实的基础。
翻阅 Top 期刊上的论文,文中的方法我们似乎都会。细细想来,原因在于这些论文的想法或视角通常都比较独特,并使用了恰当的方法来论证。这里的关键在于研究设计,而这在目前的计量教科书中却鲜有涉及。为此,本次研讨班突出两个特点:一方面,我会努力把基础知识讲解透彻,进度上不求快;另一方面,我在每个专题中都会提供了 2-3 篇比较经典的论文,展示这些方法的合理应用。
A0-A1 讲
依序介绍 Stata 的基本用法、数据处理、程序编写和可视化分析,学习这些内容无需太多的计量经济学基础,但对于提高实证分析能力和分析效率,大有裨益。本讲中,我会以一篇文章为实例,说明 Stata 的基本语法结构,并对数据处理过程中的关键问题进行介绍,如离群值的处理、文字变量的处理等。就我个人的经验而言,数据处理能力的高低直接决定实证分析的效率,而对于离群值等问题的处理是否妥善会直接影响全文结果的稳健性,是多数人不够重视但却至关重要的问题。此前有不少学完了高级班的同学又回炉初级班,便是感悟到了这一点。
A6. 一篇 Top 期刊论文重现
近期的 Top 期刊越来越强调模型不确定性,比如:控制变量也有好坏之分、是否存在非线性特征、不同模型的优劣对比等。这就需要进行各类检验,以便排除各种「混杂因素」和「似是而非」的论述,让论文的研究结论具有排他性,经济含义也更为清晰明确。本专题包括假设检验的基本原理、模型筛选和对比检验,以及「不容易做好」的稳健性检验等内容。在介绍检验方法和命令的同时,重点在于如何解释它们的经济含义,如何选择合适的检验方法并采用合适的方式加以呈现和分析。在后续的专题中,会结合具体模型设定来讲解这些检验方法的变种的灵活运用。
系数的联合检验:Wald,LR,LM 检验
R2 分解和贡献度分析
系数差异检验:Chow 检验,SUR,Bootstrap,排序检验
B2. IV 和 GMM (3 小时)
IV 的思想并不复杂,但想找到一个能说服审稿人的 IV 却往往是可遇不可求的事情。在横截面分析中确实如此。随着面板数据模型的快速发展,IV 的构造思路已经发生了很大的变化,「就地取材」、「差别反应」都是非常有用的构造思路。GMM 是估计动态面板的标准方法,它在投资方程、DSGE 等领域也是重要的估计方法。本讲以因果图为基础,介绍 IV,2SLS 和 GMM 的基本思想,辅以几篇经典论文的 Stata 实操。
IV 和 2SLS 估计的原理
GMM 估计的原理
应用 1:动态面板数据模型
应用 2:Lasso-IV
不变因果预测(Invariant causal prediction)(Kook et al., 2024)
双重有效/双重尖锐(Doubly-Valid/Doubly-Sharp)、敏感性分析(Dorn et al.,2024)
排他性检验(Goldsmith et al.,2022)
Event Study(Freyaldenhoven et al.,2021;Roth,2022)
Treeffuser(Beltran-Velezet al.,2024)
TWFE与标准DID(Wooldridge, 2021)
纽曼正交框架下的DID(包括TWFE,DRDID,DML,GRF, Npcausal)(Sant & Zhao,2020;Kennedy et al.,2023)
匹配框架下的DID(包括:PSM-DID,SDID,WGAN)(Athey et al.,2021)
多期DID(包括:CSDID,动态IPW,RIPW)(Arkhangelsky et al.,2021;Callaway & Sant,2021;Goodman-Bacon,2021;van den Berg & Gerard,2022)
