专栏名称: 连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
目录
相关文章推荐
普象工业设计小站  ·  超硬核!机械表高精度建模,全网最直观,最详尽 ... ·  5 小时前  
湖南日报  ·  查分!通道来了! ·  18 小时前  
湖南日报  ·  不要买!不要吃! ·  3 天前  
51好读  ›  专栏  ›  连享会

估计处理效应并提供非参数置信区间-xtteifeci

连享会  · 公众号  ·  · 2024-12-22 22:11

正文

👇 连享会 · 推文导航 | www.lianxh.cn

🍓 课程推荐: 连享会:2025 寒假班
嘉宾:连玉君(初级|高级);杨海生(前沿)
时间:2025 年 1 月 13-24 日
咨询:王老师 18903405450(微信)

温馨提示: 文中链接在微信中无法生效。请点击底部 「阅读原文」 。或直接长按/扫描如下二维码,直达原文:

作者 :任缘 (济南大学)
邮箱 [email protected]

编者按 :本文内容主要整理自下文,特此致谢!

  • 理论部分 :Li, X., Shen, Y., & Zhou, Q. (2024). Confidence intervals of treatment effects in panel data models with interactive fixed effects. Journal of Econometrics , 240(1), 105684. -Link- -PDF- -Google-
  • Stata 代码及数据 :Yan, Guanpeng, Li, Xingyu, Yan Shen, and Qiankun Zhou. 2024.  xtteifeci: A command for estimation and inference of treatment effects through a factor-based approach. Working Paper. -Link-

1. 背景简介

面板数据的处理效应分析结合了个体间差异和个体内动态,提供了超越单独横截面或时间序列数据所能获得的宝贵信息。然而,由于缺乏对处理组 (treat) 和控制组 (control) 的结果同时进行测量,这使得衡量处理效应变得复杂。

为了解决上述问题,Bai 和 Ng (2021) 将渐近主成分方法应用于控制组个体的子样本和 Pre 时段的子样本,以识别所有时间和所有单元的共同因素和因子载荷。接着,他们使用估计的共同成分 (即估计的共同因素乘以估计的因子载荷和一个旋转矩阵) 来预测处理组个体在 Post 时段内各个时间点的潜在结果 (反事实结果)。最后,通过简单地从观察到的处理潜在结果中减去预测的未处理潜在结果,就可以得到估计的处理效应。

在此基础上,Li 等 (2024) 使用易于实施且非参数的置信区间来估计每个处理单元在每个后处理时间点上的处理效应,从而拓展了 Bai 和 Ng (2021) 提出的基于因子的处理效应估计方法。原文中的处理效应估计和非参数置信区间是通过 Matlab 编程实现的。Yan 等 (2024) 以 Li 等 (2024) 为理论基础,编写了相应的 Stata 命令 xtteifeci

xtteifeci 基于因子方法来估计处理效应,并通过报告置信区间和 值来支持对面板数据中处理效应的统计推断。它适用于不同规格的模型,包括有或没有协变量的模型,以及平稳或非平稳的模型。

下文将详细介绍如何使用 xtteifeci 命令。

2. xtteifeci 命令

命令安装

. net install xtteifeci, from(http://fmwww.bc.edu/RePEc/bocode/x) replace
. net get xtteifeci, from(http://fmwww.bc.edu/RePEc/bocode/x) replace

命令语法

xtteifeci depvar [indepvars], treatvar(treatvarname) [options]

其中,

  • depvar :表示回归中的被解释变量。
  • indepvars :表示回归中的解释变量。
  • treatvarname :表示处理效应变量,是一个虚拟变量,用于指示一个单位在特定时期内是否接受了处理。

对于 options ,模型选项包括:

  • r(#) :指定因子数量。如果未指定 r(#) xtteifeci 会通过选项 rmethod({bn|abc}) rmax(#) 自动确定因子数量。
  • iterate(#) :指定最大迭代次数。建议将 # 设置为一个较大的正整数,默认值为 1000。
  • tolerance(tol) :指定非平稳趋势的指标。 tol 应设置为一个小的正浮点数,默认值为 0.0001。
  • trend({0|1}) :指定非平稳趋势指标。 trend(0) trend(1) 分别对应平稳和非平稳趋势,如果既未指定 trend(0) 也未指定 trend(1) ,则默认使用 trend(0)
  • bootstrap(#) :指定自抽样样本的数量。# 应设置为一个较大的正整数,默认值为 500。
  • seed(int) :指定随机种子数。
  • rmethod({bn|abc}) :指定计算因子数量的方法。 bn 用于 BN 方法 (Bai 和 Ng,2002); abc 用于 Alessi (2010) 提出的 ABC 方法。默认为 bn
  • rmax :指定最大因子数量。默认值为 8。
  • citype({eq|sy}) :指定报告的置信区间类型, eq 代表等尾置信区间, sy 代表对称置信区间,默认为 eq
  • frame(framename) :指定生成一个 Stata 框架,用于存储生成的变量。
  • nofigure :指定不生成图形。
  • savegraph(prefix, [asis replace]) :指定默认路径,将所有生成的图形保存到当前路径。仅在未指定 nofigure 时适用。

注意事项

  1. 在使用 xtteifeci 时, depvar treatvar 是必需设置的参数。
  2. indepvars 是可选项,添加它们可以帮助更准确地预测反事实结果并估计处理效应。
  3. xtteifeci 也可以用于估算多时段的处理效应。

3. Stata 实操

3.1 案例1:香港与中国大陆的政治和经济一体化对其 GDP 增长的影响

在 Li (2024) 年的文章中,使用 Hasio (2012) 所研究的课题“香港与中国大陆的政治和经济一体化对其 GDP 增长的影响”来验证所提出的非参数置信区间在处理效应评估中的有效性。论文得出的结论如下:

首先,关于政治一体化对香港 GDP 的影响,其结论通过图表展示如下:

图中展示了政治一体化对香港 GDP 增长的估计处理效应以及相应的 90% 和 95% 置信区间。估计的处理效应与 Hsiao (2012) 发现的效应大小相似。即香港的实际 GDP 增长率在主权变更后的前 2 年内,显著受到与中国内地政治一体化的负面影响。然而,在 1999 年中期之后,大多数时候的影响是不显著的,而有少数几次则显著为正面。

下面在 Stata 中使用 xttfifeci 来对处理效应进行估计并增加置信区间。

首先,调用并声明面板数据。

. use growth2, clear
. xtset region time

接下来,使用 panelview 来可视化政治一体化 (pi) 变量在处理组和对照组中的分布。 panelview 可以通过运行命令 ssc install panelview, replace 来安装。具体的使用方法可以参考这篇推文 Stata 绘图:面板数据可视化-panelview。

. panelview gdp pi, i(region) t(time) type(treat)

利用 xtteifeci pi 没有缺失的情况下检验处理效应:

. xtteifeci gdp if !missing(pi), treatvar(pi)

上图展示了 xtteifeci 报告的结果。可以观察到,在政治一体化的前 2 年,香港的 GDP 增长率显示出明显的下降趋势,而在政治一体化之后,大多数影响并不显著 (置信区间包含 0)。通过对比 Treatment Effects ,这些结果与 Li (2024) 的图形结论一致。

同样,按照相同的思路和方法可检验经济一体化的处理效应,下图为 Li (2024) 的图形结论。

以下是使用 xtteifeci 的步骤和结果:

. use growth2, clear
. xtset region time
. qui panelview gdp ei, i(region) t(time) type(treat)
. xtteifeci gdp if !missing(ei), treatvar(ei) // ei代表经济一体化的虚拟变量

对比 Treatment Effects ,与 Li (2024) 的图形结论一致。

Li (2024) 的图形结论是通过 Matlab 生成的,而使用 xtteifeci ,我们可以在 Stata 中轻松地估计处理效应,并基于置信区间直观地评估处理效应的有效性。

3.2 案例2:加州禁烟对人均烟草消费的影响

在 Li (2024) 的论文中,还展示了加州烟草控制计划 (CTCP) 的处理效应估计及其 90% 和 95% 的置信区间,如图所示:

可以发现,所展示的处理效应在大小和趋势上与 (Abadie 等,2010) 相似。置信区间表明,随着时间的推移,CTCP 对加州人均香烟消费产生了显著的负面影响。

下面用 xtteifeci 来实现同样的效果。首先,是调用数据集以及声明面板数据。

. use smoking2, clear
. xtset state year

然后,使用 xtteifeci 命令。

. xtteifeci cigsale lnincome eduattain poverty, treatvar(ctcp) trend(1) rmethod(abc)
. /*
> 对带有协变量、非平稳趋势和 abc 法计算出的因子数的模型进行处理效应估算
> ctcp为处理变量,即state为加州时,ctcp取1,否则为0
> cigsale是因变量,即人均烟草消费;lnincome eduattain poverty为协变量
> */

得到的处理效应估计以及置信区间如下图所示,对应 Li (2024) 的 Equal-Tailed CIs (等尾置信区间)。

同样,我们可以在命令中指定置信区间的类型,以此生成对称置信区间,对应 Li (2024) 的 Symmetric CIs

. xtteifeci cigsale lnincome eduattain poverty, treatvar(ctcp) trend(1) rmethod(abc) citype(sy)
. /*
> 与上面的区别在于指定了citype的类型为sy (对称置信区间)
> 你同样可以按照前文所述的语法定制非平稳趋势trend(),计算因子数量的方法rmethod()等选项
> */

对比 xtteifeci 生成的结果,与 Li (2024) 的结论相似。







请到「今天看啥」查看全文