所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.1.有意思的实证计量讨论帖, 熬夜肝完了一直的计量困惑!2.QA: 平方项的IV, 加时间固定符号相反, 滚动窗口回归, 面板分位数输出图, 机制分析中IV, pre5显著咋办,3.主回归不显著, 分组回归却异常显著的研究来了!4.城市*年份联合的FE与他们分开的FE有什么区别? FE如何从一维进化到二维, 三维的? 5.审稿人: 你这个文章实证结构已经过时了!过时了!6.当把交互项加入后, 主项的系数符号竟变相反了, 这是咋回事? 如何处理呢?7.DID可以有2个处理组和1个对照组么? 有相关的参考文献吗? 8.12年试点, 15年推广到全国的政策, 回归时是否包括16和17年数据?
与此同时,达特茅斯Ethan Gatewood Lewis教授也给出了意见和示例说明。他最终的结论是,在面板数据回归中总要养成控制年份固定效应的习惯。
当然,需要说明的是,依然要具体问题具体分析,毕竟也有很多群友说在JF、RFS等金融学TOP刊也出现了不控制时间固定效应的情况。参考:可以只控制个体固定效应, 不控制时间固定效应吗?
总要控制年度效应
为什么控制年度固定效应很重要?
年度固定效应,亦称为年度虚拟变量或每年数据中的虚拟变量(不包括首年),对于捕捉总体(时间序列)趋势的影响至关重要。时间序列数据通常不足以作为因果推断的可靠依据,因为它们缺少有力的反事实支持。在许多情况下,时间序列变量可能会因为总体变量的变化(例如通货膨胀、经济增长、人口增长等)而表现出虚假的相关性。
以美国为例,时间序列数据揭示了两个很可能没有因果联系的变量(贸易逆差规模和医疗保健支出)之间的相关系数R平方值竟高达0.9以上。更普遍地讲,时间序列回归,包括未考虑年度效应的面板回归,往往会捕捉到与因果关系无关的总体趋势。
让我们通过一个城市面板回归的实例来探讨不控制年度效应可能带来的问题。假设掌握了1982年和1987年46个美国城市的犯罪率和失业率数据。在这五年间,总体趋势显示犯罪率上升,而失业率下降。为了更清晰地观察这一现象,可以查看按年份分类的城市数据的平均值。
从1982年到1987年,城市的平均犯罪率从每千人97.7起上升至103.8。值得注意的是,这种总体犯罪率的增长并不被看作与失业率下降有直接的因果联系(这种联系是如何形成的呢?)。实际上,犯罪率的增加可能更多地与人口结构的变化、收入不平等的加剧或毒品交易的演变有关。同样,失业率的显著下降(从10%降至5.9%)也不被认为与犯罪率上升有直接的因果关系,而是与经济周期的变动相关,特别是1980年代初期严重衰退的结束。
现在,设想我们用这些数据来分析犯罪率与失业率之间的关系,进行面板回归分析,就像在课堂上做的那样,但在模型中没有考虑年度效应(如表中的第1列和第3列所示):
OLS回归分析:每千人犯罪率与失业率的关系
请留意,在第1列和第3列的回归分析中,我们没有考虑年度效应,结果显示失业率的系数为负值。这似乎暗示着失业率越高,犯罪率反而越低!(但这真的意味着存在因果关系吗?我们能否通过裁员来降低犯罪率?你自行判断。)然而,这种结果实际上是由于忽略了年度效应而产生的误导。当我们控制了年度效应后,系数转变为(更符合逻辑的)正值。换句话说,未控制年度效应时,遗漏变量偏差导致了负值,这与1980年代犯罪率上升和失业率下降的总体趋势有关。因此,必须控制这一因素,以确保总体趋势不会扭曲我们对城市间回归结果的分析。
所以,务必在面板回归中控制年度固定效应!
另一个引人注意的现象是,在第3列和第4列的数据中,一旦我们纳入了城市固定效应(也就是为每个城市设立的虚拟变量),R平方值便显著提升。这种固定效应通常能够捕捉到数据中的大部分变异性。虽然通常情况下,这会增加标准误差,但在本案例中,我们似乎并未观察到这种效应。
关于固定效应,参看:1.交互项! 交互项! 固定效应回归模型中的交互项!2.在Stata中如何做2SLS, DID, DEA, SFA, 面板PSM, 二值选择, 固定效应和时间序列?3.一定要控制时间固定效应吗?4.公司和个体固定效应总是更好吗? 关于固定效应使用和解释的最全指南!5.使用固定效应FE时良好做法对应的检查清单,6.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,7.快速估计带有高维固定效应的泊松模型, 这计算速度真快, 真实用!8.不能直接控制某个固定效应时, 我们能尽量做些什么呢?9.时间固定效应和时间趋势项的区别, 可以同时加?10.省份/行业固定效应与年份固定效应的交乘项固定效应,11.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,12.广义合成控制法gsynth, 基于交互固定效应的因果推断,13.固定效应模型+测量误差=有问题, 如何解决这问题呢?14.到底控制什么层面的固定效应? 最低, 最高, or随意?15.固定效应: 目前看到解释的最清楚的帖子, 救命!16.固定效应模型+测量误差=有问题, 如何解决这问题呢?17.TOP5被质疑用log(1+x)数据转换, 固定效应, 双重差分事件图, 结论不可靠!18.审稿人: 如何在双向固定效应下还能估计出不随个体变化的宏观变量呢?一些讨论,1.七大常见计量问题讨论汇总, 涉及控制,异质,机制,DID,DDD,调节,固定,平行,安慰等,2.关于双重差分DID政策评估中的控制变量选取标准?3.在平行趋势检验中对政策前后系列年份进行缩尾处理?4.使用异方差稳健而不是聚类稳健标准误, 在固定效应模型中能接受吗?5.平行趋势通不过, 该采取什么方法来更好地满足平行趋势呢?6.QA: 基尼太美, 农业数据, 机制检验, 组间差异, 博士论文创新, 控制函数, FM回归 7.审稿人: 你2SLS-IV回归中为啥R方是负数呢?
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
7年,计量经济圈近2000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。