这篇文章提供了一系列关于Stata软件的教程和相关信息,包括Stata19和Stata18的新功能、统计功能、数据作图、学习资源等。同时,文章还探讨了因果推断中的处理效应估计量,如ATE、ATT、ATU、LATE、MTE等,并介绍了它们在不同情境下的应用和意义。此外,文章还介绍了边际处理效应(MTE)的概念、估计方法和与其他效应估计量的关系。最后,文章还推荐了用于数据处理和计量分析的Stata、R和Python软件,并提供了相关的数据处理技巧和数据来源。
文章介绍了Stata19和Stata18的新功能,包括ML、CS升级,及Stata资料分享,提供了统计功能、数据作图、学习资源等。
文章讨论了ATE、ATT、ATU、LATE、MTE等处理效应估计量,并解释了它们在不同情境下的应用和意义。
文章介绍了MTE的概念、估计方法和与其他效应估计量的关系,强调了它对于理解处理效应异质性和个体选择行为的重要性。
文章推荐了用于数据处理和计量分析的Stata、R和Python软件,并提供了相关的数据处理技巧和数据来源。
凡是搞计量经济的,都关注这个号了
邮箱:
[email protected]
所有计量经济圈方法论
丛的code程序
, 宏微观
数据库和各种软
件都放在社群里.欢迎到计量经济圈社群交流访问
.
我们天天都在谈论ATT、ATE、ATU、ITT、LATE、MTE等,那么它们到底什么意思呢?有什么关联呢?能够在某个框架下统一起来么?
我们都知道,在经济学和公共政策等众多领域,仅仅提出“处理是否有效?”这样的问题是不够的。不同的研究问题和政策目标要求我们精确地定义和估计不同类型的处理效应。
因果推断的潜在结果框架为定义这些效应提供了严谨的理论基础。该框架的核心思想是,对于每一个个体(或研究单元),都存在两种潜在的结果:一种是在接受处理的情况下产生的结果,另一种是在未接受处理的情况下产生的结果。
个体层面的因果效应就是这两种潜在结果之间的差异。然而,在实际研究中,我们无法同时观察到同一个体在两种状态下的结果(这是因果推断的基本难题),因此通常关注的是不同人群或子群体的平均处理效应。
下面看看因果推断中常用的各种处理效应估计量(estimands)。
1️⃣先上一些常见的,基础平均处理效应:ATE、ATT、ATC
在因果推断中,最基本且最常用的处理效应包括平均处理效应(average treatment effect, ATE)、处理组平均处理效应(average treatment effect on the treated, ATT)和控制组平均处理效应(average treatment effect on the control/untreated, ATC/ATU)。
它们都基于潜在结果框架进行定义,但关注的人群范围不同。
A. 平均处理效应 (ATE):
ATE 指的是在整个目标人群(或样本)中,个体接受处理与不接受处理两种状态下潜在结果的平均差异。它衡量的是如果将处理措施推广到整个人群,平均而言会对结果产生多大的影响。估计量 (Estimand): ATE = E[Y(1) - Y(0)] ,其中Y(1) 是接受处理时的潜在结果,Y(0) 是未接受处理时的潜在结果,E[] 表示期望(平均值)。
当研究者关心一项政策或干预对所有符合条件的个体的普遍效果时,ATE 是最相关的估计量。例如,评估一项旨在提高所有学生考试成绩的新教学方法的效果,或者评估一种新药对所有目标患者群体的平均疗效。政策制定者在考虑是否向所有符合条件的公民推广某项福利计划时,会关心该计划的 ATE。注意,ATE 考虑的是对整个人群的平均效应,无论个体实际上是否接受了处理。
ATE提供了一个关于处理措施整体影响的概览性度量,对于旨在影响广泛人群的政策决策非常有用。在理想的随机对照试验(RCT)中,通过简单的组间均值比较即可无偏估计 ATE。不过,ATE 可能掩盖处理效应在不同子群体间的异质性;在观测性研究中,由于存在混淆因素,ATE 的识别和估计通常需要更强的假设(如可忽略性/无混淆性)。
Stata: ttest y, by(treat) 或 regress y treat, robust。
R: t.test(y ~ treat, data=...) 或 lm(y ~ treat, data=...) 后使用 coeftest 获取稳健标准误。
回归调整 (RA): 假设条件独立性,通过回归模型控制混淆变量 (X)。
Stata: regress y treat x1 x2..., margins, dydx(treat)。teffects ra (y x1 x2...) (treat x1 x2...)。
R:`lm(y ~ treat + x1 + x2..., data=...)`,使用 `margins` 包。
倾向得分匹配 (PSM): 基于倾向得分 ((P(D=1|X)) 匹配处理组和控制组个体。
Stata: teffects psmatch (y) (treat x1 x2...) (优于 psmatch2,因其能正确计算标准误)。
R: MatchIt 包。使用完全匹配或匹配后加权估计 ATE。
逆概率加权 (IPW): 对处理组个体赋予权重 ((1/hat{e}(X)),对控制组个体赋予权重 ((1/(1-hat{e}(X))).
Stata: teffects ipw (y) (treat x1 x2...).
R: WeightIt 包, survey 包进行加权回归。
双重稳健 (AIPW, IPWRA): 结合结果回归模型和处理分配模型。
Stata: teffects aipw (y x1 x2...) (treat x1 x2...), teffects ipwra (y x1 x2...) (treat x1 x2...).
B. 处理组平均处理效应 (ATT):
ATT 指的是实际接受了处理的那部分个体的平均因果效应。
它回答的问题是:
“对于那些实际参与了项目的人来说,这个项目的平均效果是什么?
” 估计量 (Estimand): ATT = E[Y(1) - Y(0) | D=1],其中 (D=1) 表示个体实际接受了处理。
这可以分解为E[Y(1)|D=1] - E[Y(0)|D=1]。
注意 E[Y(1)|D=1] 可以通过观测处理组的平均结果E[Y|D=1]得到,但 E[Y(0)|D=1]是处理组未接受处理的反事实结果,需要估计。
当评估一个现有项目或政策对其参与者的效果时,ATT 通常是最受关注的估计量。例如,评估一项职业培训计划对那些选择参加该计划的人的收入影响。在决定是否应该继续为当前用户提供某项干预时,ATT 很有意义。注意,ATT 只关注处理组(D=1),而 ATE 关注整个群体,ATU 关注控制组 (D=0)。
ATT直接衡量了干预对其目标群体的影响,对评估现有项目的效果和参与者获益情况非常有用;
在观测性研究中,估计 ATT 通常比估计 ATE 更容易
,因为它只需要估计处理组的反事实结果。不过,如果处理组与未处理组存在系统性差异(选择偏差),ATT 的结果可能无法推广到整个人群;估计反事实 E[Y(0)|D=1]具有挑战性,需要依赖假设。
RCT中实现代码: 由于随机化保证了组间可比性,ATT 与 ATE 相同,可通过组间均值差异估计。
回归调整 (RA): 类似于 ATE,但需要针对处理组进行预测和平均。
Stata:
teffects ra (y x1 x2...) (treat x1 x2...),
atet
.
倾向得分匹配 (PSM): 标准的 PSM 应用通常目标就是估计 ATT(为处理组匹配对照组)。
Stata:
teffects psmatch (y) (treat x1 x2...), atet
.
逆概率加权 (IPW): 对处理组使用权重 (1),对控制组使用权重 ((hat{e}(X)/(1-hat{e}(X)))).
Stata:
teffects ipw (y) (treat x1 x2...), atet
.
R:
WeightIt
包设置
estimand="ATT"
.
Stata:
teffects aipw (y x1 x2...) (treat x1 x2...), atet
,
teffects ipwra (y x1 x2...) (treat x1 x2...), atet
.
R:
DoubleML
包,或手动实现针对 ATT 的估计。
C. 控制组/未处理组平均处理效应 (ATC/ATU):
ATU 指的是那些未接受处理的个体的平均因果效应。
它回答的问题是:
“如果那些未接受处理的人接受了处理,他们的平均效果会是怎样?
” 估计量 (Estimand): AT
U
= E[Y(1) - Y(0) | D=0]。
这可以分解为E[Y(1)|D=0] - E[Y(0)|D=0]。
E[Y(0)|D=0]可通过观测控制组的平均结果E[Y|D=0]得到,但 E[Y(1)|D=0]是控制组接受处理的反事实结果,需要估计。
评估将一种新药(目前只给重症患者使用)推广给那些目前未使用的轻症患者可能带来的潜在益处。在考虑是否扩大项目覆盖范围时,AT
U
具有参考价值。注意,AT
U
只关注控制组(D=0).
ATU有助于理解处理措施对未参与者的潜在影响,为扩大干预范围提供信息。不过,估计反事实E[Y(1)|D=0]需要假设;如果扩大干预不可行或不合意,其政策相关性可能低于 ATT。
观测数据中实现代码: 方法与 ATT 类似,但目标是控制组。
Stata: 估计
teffects ra (y x1 x2...) (treat x1 x2...)
,
atet
后,使用
margins, subpop(if treat==0) expression(predict(pom1) - predict(pom0))
。
倾向得分匹配 (PSM): 为控制组匹配处理组个体。标准的匹配算法不常直接估计 AT
U
,但可通过修改或完全匹配实现。
Stata:
teffects psmatch
不直接估计 AT
U
,但可通过
的关系推导。
R:
MatchIt
包的部分方法可以估计 AT
U
,或通过反转处理编码实现。
ATE 是 ATT 和 ATU 的加权平均:
在观测性研究中,简单比较处理组和控制组的平均结果E[Y|D=1] - E[Y|D=0] 并不等于 ATE 或 ATT。这个差异实际上等于
。
花括号中的项被称为“选择偏差”,它反映了处理组和控制组在未接受处理情况下的潜在结果差异(即基线差异)。
如果选择偏差不为零,说明处理组和控制组在接受处理前就存在系统性差异。
例如,参加职业培训的人(D=1)可能比不参加的人(D=0)本身就更有动力(可能导致更高的 Y(0)或更需要帮助(可能导致更低的Y(0))。
随机对照试验RCT通过随机分配处理,旨在消除选择偏差,使得处理组和控制组在期望上具有可比性。
观测性研究中的各种方法(匹配、回归、IPW、IV 等)都是为了通过控制混淆变量来尽可能地消除或减小选择偏差。
从 ATE/ATT/ATU 差异理解选择过程,在观测数据中,ATE、ATT 和 ATU 的差异揭示了选择过程的性质。如果 ATT > ATE > ATU,这通常意味着那些选择接受处理的人(处理组)从中获得的收益高于平均水平,而那些选择不接受处理的人(控制组)如果接受处理,其收益将低于平均水平。这表明存在“正向选择”(基于收益选择)。
反之,如果 ATT < ATE < ATU,则表明存在“负向选择”。这种差异的根源在于,观测数据中的处理组和控制组并非人群的随机子集,他们在潜在结果上本身就可能存在差异。例如,ATT 和 ATE 的差异主要由E[Y(0)|D=1]与 E[Y(0)]的差异驱动,而 ATU 和 ATE 的差异主要由E[Y(1)|D=0]与 (E[Y(1)]的差异驱动。通过比较这三个估计量,研究者可以推断选择偏差的方向和可能的原因。
政策相关性决定估计量选择,选择 ATE、ATT 还是 ATU,根本上应由研究问题和政策目标驱动,而非仅仅出于方法上的便利。例如,如果一项政策(如自愿参与的培训项目)只影响选择加入的子群体,那么使用 ATE 可能无法准确反映该项目对实际参与者的影响(ATT 更相关)或其对未参与者的潜在影响(ATU 更相关)。
研究者必须根据决策背景明确其目标估计量,并论证其选择的合理性。虽然 RCT 自然地估计 ATE,但如果现实世界的实施涉及自我选择,那么试验得到的 ATE 对于评估实际运行中的项目效果可能并非最相关的参数。
2️⃣如果处理的分配不完美,可以考虑局部平均处理效应 (LATE)
在理想的实验中,所有被分配到处理组的个体都会接受处理,而分配到控制组的个体则不会。然而,在现实世界的实验(包括随机对照试验)和准实验研究中,经常出现不依从(non-compliance)的情况,即个体实际接受的处理 (D) 与其被分配到的处理 (Z) 不一致。
例如,被分配到服药组的患者可能忘记服药 (Z=1, D=0),而被分配到安慰剂组的患者可能通过其他渠道获得了药物 (Z=0, D=1)。这种不依从性给因果效应的估计带来了挑战。
首先,意向性分析 (Intent-to-Treat, ITT): ITT 分析比较基于最初随机分配的组别 (Z=1) vs (Z=0) 之间的平均结果差异,而忽略个体实际接受的处理 (D)。其估计量为ITT = E[Y|Z=1] - E[Y|Z=0]。
ITT 保留了随机分组的优势,避免了因依从行为本身可能引入的选择偏差(因为依从行为发生在随机化之后),因此 ITT 估计量通常被认为是无偏的(针对“分配效应”)。
它估计的是提供或意图进行处理的效果,这对于评估公共卫生政策或项目推广策略的效果通常很有意义。
不过,由于混合了依从者和不依从者的结果,ITT 通常会低估处理本身对那些实际接受并遵守了处理方案的个体的真实效果(即处理本身的效力)。
依从者分析/处理接受分析 (As-Ttreated / Per-protocol analysis)(一般不推荐): 这种分析直接比较实际接受了处理的个体 (D=1) 与实际未接受处理的个体 (D=0) 之间的结果差异,完全忽略了最初的随机分配。不过,这种方法破坏了随机化的基础。因为依从行为(选择接受或不接受处理)通常与个体的潜在结果相关(例如,病情更重的患者可能更倾向于寻求治疗),直接比较会导致严重的选择偏差。因此,“As-treated”分析通常会产生有偏的因果效应估计,一般不被推荐用于因果推断。
B. 依从者类型划分 (Angrist, Imbens, Rubin)
为了在存在不依从的情况下估计处理本身的效应,Angrist, Imbens, 和 Rubin (1996) 提出了基于个体对处理分配 (Z)的潜在反应来划分人群的方法。假设 D_i(z)表示个体 i在被分配到处理状态
时,其
实际会采取
的处理状态D=1或D=0. 根据D_i(1) 和D_i(0) 的组合,可以将人群分为四类:
依从者 (Compliers):D_i(1)=1且D_i(0)=0。这类人当且仅当被分配到处理组时才接受处理,他们完全遵守分配。
从不接受者 (Never-takers): D_i(1)=0 且D_i(0)=0。这类人无论被分配到哪个组,都不会接受处理。
总是接受者 (Always-takers): D_i(1)=1 且 D_i(0)=1。这类人无论被分配到哪个组,总会设法接受处理。
反抗者 (Defiers): D_i(1)=0 且D_i(0)=1。这类人总是做与分配相反的事情:分配到处理组则不处理,分配到控制组反而去处理。
C. 局部平均处理效应 (LATE) / 依从者平均因果效应 (complier average causal effect, CACE)
LATE(或 CACE)指的是处理对依从者 (Compliers) 这个特定子群体的平均因果效应。估计量 (Estimand): LATE = E[Y(1) - Y(0) | D_i(1)=1, D_i(0)=0]。
LATE 主要用于存在不依从性的实验或准实验(如使用工具变量)中,目的是估计处理本身的效果,而不是处理分配的效果。例如,在一项鼓励使用某种新肥料的随机实验中(Z=1) 表示收到鼓励信息,(Z=0) 表示未收到,有些农民收到信息但未使用新肥料(Never-taker 或 Non-complier in treatment arm),有些未收到信息的农民可能自己采用了新肥料(Always-taker 或 Non-complier in control arm)。LATE 估计的是新肥料对那些因为收到了鼓励信息而决定使用新肥料的农民(即依从者)的产量的平均影响。
LATE ≠ ITT,
ITT 是对所有被分配到处理组的人(相对于控制组)的平均效应,包括了依从者、从不接受者和总是接受者(如果存在于控制组),因此效应通常被稀释。LATE 只关注依从者。
LATE ≠ ATE,ATE 是对整个人群的平均效应,包括所有四种类型的人。LATE 只针对依从者。
LATE ≠ ATT,ATT 是对所有实际接受了处理的人的平均效应 (D=1),这包括了依从者和总是接受者。LATE 只关注依从者。
LATE 的“局部性”表现在,LATE 的值取决于定义依从者的工具变量(即处理分配机制)。
使用不同的工具(例如,不同的鼓励方式)可能会影响不同的人群(不同的依从者群体)
,从而得到不同的 LATE 估计值。
在存在不依从的情况下,LATE提供了一个对处理本身效果的因果估计,且该估计针对的是一个由工具变量(政策干预)实际影响的、具有政策意义的子群体(依从者);可以通过工具变量(IV)方法进行识别和估计。不过,估计结果只适用于依从者,其外部效度可能有限,不能直接推广到整个人群或其他子群体(如从不接受者、总是接受者);依从者群体在数据中是“潜在”的,无法直接识别出哪些个体是依从者;估计 LATE 依赖于较强的 IV 假设,这些假设有时难以满足或验证。
LATE 的识别和估计通常依赖于工具变量(IV)方法,其中,处理分配(Z)被用作实际接受处理(D) 的工具变量。
工具变量 (Z)(如随机分配)通过影响个体的处理决策(D),进而影响结果(Y). IV 方法利用(Z) 对(D)的外生影响(不受混淆因素干扰的部分)来识别(D)对 (Y) 的因果效应。
关键 IV 假设 (Imbens & Angrist, 1994):
相关性 (Relevance): 工具变量(Z)必须与内生变量(实际处理)(D) 相关。即
,或者在 LATE 框架下,
。
这个差值 E[D|Z=1] - E[D|Z=0]正是(依从者比例 - 反抗者比例)。
相关性可以通过检验“第一阶段”回归中工具变量的系数是否显著不为零来判断。
独立性/随机性 (Independence/Exogeneity): 工具变量(Z)必须是(条件)随机分配的,即(Z)与潜在结果(Y(0), Y(1))以及潜在依从类型(由 (D(0), D(1)) 决定)无关(可能需要以协变量 (X) 为条件)。在随机对照试验中,该假设通过设计得到满足。在观测研究中,需要论证工具变量的“准随机性”。
排他性限制 (Exclusion Restriction): 工具变量(Z)只能通过影响处理 (D)来影响结果 (Y),不能有其他直接影响(Y)的路径。即Y(d, z) = Y(d)。这意味着分配本身(比如收到鼓励信息这个动作)除了改变个体是否接受处理外,不应直接改变其结果。这是一个关键但通常无法直接检验的假设,需要依赖理论或背景知识进行论证。
单调性 (Monotonicity): 不存在反抗者(Defiers)。即对于所有个体 (i),
。
这意味着工具变量(Z)对所有人要么是推动其接受处理,要么是没影响,但绝不会使其从接受处理变为不接受处理。
在满足上述四个假设的条件下,
LATE 可以通过 Wald 估计量来识别
:
其中,ITT_Y是 (Z) 对结果 (Y) 的意向性处理效应,ITT_D是 (Z) 对实际处理 (D) 的意向性处理效应(即依从率,在没有反抗者的情况下)。
LATE 等于结果的 ITT 除以处理接受度的 ITT
。
2SLS 是估计 IV 模型(包括 LATE)的常用方法。
第一阶段: 将内生处理变量(D)对工具变量(Z)和所有外生协变量 (X)进行回归:
得到 (D) 的预测值
。
这一步检验了相关性假设(
的显著性)并分离出 (D) 中由 (Z) 外生驱动的部分。
第二阶段: 将结果变量(Y)对预测出的处理变量
和外生协变量(X)进行回归:
。
系数
就是 LATE 的 2SLS 估计值。
在Stata中的命令是
ivregress 2sls y x (d = z)
或
ivreg2
。其中
y
是结果,
x
是外生协变量,
d
是实际处理(内生),
z
是工具变量(处理分配)。
查看第一阶段回归结果(可用
first
选项显示)的 F 统计量。通常建议 F 值大于 10 以避免弱工具变量问题。
在R中主要包和函数:
AER
包中的
ivreg()
函数:
ivreg(y ~ d + x | z + x, data=...)
.
|
左边是第二阶段模型结构,右边是第一阶段的工具变量和外生协变量。
summary(iv_model, diagnostics=TRUE)
会报告包括 F 统计量在内的诊断信息。
首先要明确指出使用的工具变量是什么,并详细论证其满足 IV 假设(尤其是排他性限制)的理由。
必须报告第一阶段的结果,包括工具变量对处理接受度的影响大小(系数)和统计显著性(如 F 统计量),以证明相关性并评估弱工具变量风险。
LATE 解释——将估计出的系数解释为依从者的平均因果效应,即那些因为工具变量状态改变而改变了自身处理状态的个体的平均效应。
同时要承认IV估计存在局限性,因此需要讨论潜在的假设违规(如排他性限制不成立、存在反抗者)及其可能的影响。承认 LATE 的局部性,并讨论其外部效度(能否推广到依从者之外的人群)。
如果可能,尝试描述依从者群体的特征(与总是接受者、从不接受者相比)一些 Stata/R 包(如 Stata 的
cmp
或 R 的
ivdesc
)可以帮助分析依从者特征。
LATE 与异质性的关系是啥?LATE 本身虽然是一个局部效应,但 IV 框架迫使我们思考工具变量如何影响行为(第一阶段)以及该行为如何影响结果(缩放后的 ITT)。这个结构是理解更高级异质性模型(如边际处理效应 MTE)的基础,MTE 明确地根据个体接受处理的倾向性来建模异质性。
LATE 可以看作是在工具变量影响下的那部分未观测抵抗力范围内的 MTE 的平均值。
因此,理解 LATE 是通往更丰富的 MTE 框架的桥梁,后者旨在更全面地描绘异质性。
通过 IV 识别 LATE 需要比识别 ITT 更强的假设(排他性、单调性)。此外,LATE 估计的精度(标准误大小)高度依赖于工具变量的强度(第一阶段 ITT_D的大小)。弱工具变量ITT_D接近零会导致 LATE 估计量非常不稳定(标准误巨大)且可能存在严重偏误。
ITT与LATE估计之间存在trade-off:ITT 在随机对照试验中稳健可识别,但估计的是分配效应;LATE 估计的是依从者的处理接受效应,但依赖更强的假设和强有力的工具变量。
3️⃣进阶到理解选择与异质性,边际处理效应 (MTE)
边际处理效应 (marginal treatment effect, MTE) 提供了一个更深入理解处理效应异质性与个体选择行为之间关联的框架,尤其是在存在内生性(如自我选择参与处理)和需要工具变量的情况下。
MTE 由 Heckman 和 Vytlacil 等人发展完善,所以不得不承认Heckman在计量上很有造诣。
MTE 是指在给定观测协变量 (X=x) 的条件下,对于那些在接受处理与不接受处理之间处于“边际”状态的个体,他们的平均处理效应。这个“边际”状态通常通过一个潜在的、未观测到的“接受处理的净效用”或“抵抗处理的倾向”
来定义。
MTE 函数表示为
。
代表了所有影响个体处理选择但未被 (X) 和工具变量 (Z) 捕捉到的未观测因素。
它可以被理解为个体参与处理的“未观测成本”或“抵抗力”。
通常将其标准化为在 [0, 1] 区间上均匀分布的变量,此时
表示个体在这种未观测抵抗力分布中所处的分位数。
较低的个体倾向于接受处理(抵抗力低),
较高的个体倾向于不接受处理(抵抗力高)。
MTE 描绘了处理效应如何随着个体未观测到的处理倾向性(从最倾向于处理到最不倾向于处理)的变化而变化。如果 MTE 曲线是下降的,意味着那些本身更倾向于接受处理的个体(低
) 从处理中获益更大(选择效应为正);如果是上升的,则意味着那些更不倾向于接受处理的个体(高
) 反而获益更大(选择效应为负)。
MTE 的一个强大之处在于它提供了一个统一的视角,许多其他常用的处理效应估计量(如 ATE, ATT, ATU, LATE, )都可以表示为 MTE 函数 MTE(x,
) 在
维度上的不同加权积分。权重函数由所关注的估计量以及倾向得分 P(X, Z)的分布决定。
具体关系 (以给定 (x) 为条件):
(对所有
的简单平均)
(权重集中在处理组的
分布上)
(权重集中在控制组的
分布上)
(LATE是MTE 在由工具变量
改变所定义的依从者(其
介于 (P(x,z) 和 (P(x,z')之间)范围内的平均值)。
政策相关处理效应 (PRTE) 也是 MTE 的加权平均,权重取决于政策变化如何影响倾向得分的分布。
MTE 的识别和估计严重依赖于有效的工具变量 (Z)。这些 (Z) 必须影响处理决策 (D),但不能直接影响潜在结果 (Y(0), Y(1)(满足排他性限制)。为了能够追踪 MTE 曲线,最好拥有连续或多取值的工具变量,因为它们可以诱导出更广泛的倾向得分变化。
第一,局部工具变量法 (local instrumental variables, LIV)是估计 MTE 的一种主要非参数方法。它利用了 MTE 与条件期望结果对倾向得分p = P(X, Z)的导数关系:
。
在实践中,这通常通过对
进行局部多项式回归(以 p为平滑变量)并计算其导数来实现。
第二,参数/半参数方法 (基于广义 Roy 模型),它是假定潜在结果方程和处理选择方程的具体函数形式(通常假定误差项服从某种联合分布,如多元正态分布),这构成了广义 Roy 模型。在这种框架下,可以通过控制函数法(类似于 Heckman 选择模型)或最大似然法来估计模型参数,进而推导出 MTE 函数。
需要注意的是,可分离性假设 (Separability Assumption)在MTE估计中很重要。为了简化估计(尤其是在协变量 (X) 维度较高时),通常会假设未观测异质性在结果方程中是可分离的,即
(其中 (U_j) 是结果方程的误差项)。
这意味着协变量X只能使 MTE 曲线上下平移,而不能改变其形状。
这是一个较强的假设,但有助于识别。
MTE提供了比 ATE/ATT/LATE 更为丰富和深入的异质性信息。明确地将处理选择行为基于未观测因素
与处理效应联系起来,有助于理解选择偏差的来源。在一定假设下,可以从估计出的 MTE 函数推导出或外推出各种政策相关的处理效应参数(ATE, ATT等)。统一了 IV、选择模型和控制函数等多种处理内生性的方法。
不过MTE需要较强的假设——有效的工具变量(相关性、排他性)、函数形式假设(对参数方法)、可分离性假设等。估计过程通常比较复杂,且对数据量要求较高。需要高质量的工具变量,特别是能够诱导出足够倾向得分变化的连续或多值工具。此外,
(未观测抵抗力)的解释有时比较抽象。
在Stata中mtefe 实现了 LIV 和参数化的 MTE 估计方法,可以计算多种处理效应参数,提供标准误估计和图形输出。而margte实现了参数化和半参数化的 MTE 估计方法。
在R中ivmte 包基于 Mogstad 等人 (2018) 的框架实现 MTE 方法,特别关注于在识别不足时计算效应的界限(bounds)和进行敏感性分析。也可以使用 R 中的局部多项式回归包(如 locpol 或 np)来拟合 (E[Y|X, P]) 对 (P) 的关系,然后计算导数。如果模型结构符合某些选择模型(如 Heckman 模型),可以尝试使用 sampleSelection 等包进行估计,但这需要仔细调整以匹配 MTE 框架。
MTE能够帮忙解释 LATE 的“局部性”,MTE 框架为理解 LATE 估计值为何会因使用的工具变量不同而变化提供了深刻的解释。不同的工具变量(例如,不同的鼓励设计或自然实验)会影响处于不同“边际”状态的个体群体,即它们会改变不同范围的未观测抵抗力
的个体的处理决策。由于 LATE 是 MTE 在特定工具变量所影响的
范围内的平均值,如果 MTE 曲线不是水平的(即处理效应随
变化),那么使用不同的工具变量(对应不同的积分区间)就会得到不同的 LATE 值。这再次强调了 LATE 的“局部”性质,并表明 MTE 曲线是理解这种变异性的关键。
要想非参数地估计出完整的 MTE 曲线(即覆盖
从 0 到 1 的范围),需要工具变量能够在很大范围内改变个体的倾向得分。这通常意味着需要非常强的、连续的或多个能够联合诱导出广泛倾向得分变化的工具变量。
如果工具变量只能引起倾向得分在很小范围内的变动(例如,从 0.4 到 0.6),那么非参数方法(如 LIV)就只能识别出该范围内的 MTE。
在这种情况下,要想得到对整个
范围的 MTE 估计,就不得不依赖更强的参数化假设(如联合正态性)来进行外推,而这些假设可能并不成立。
这凸显了工具变量的质量和强度对于 MTE 估计至关重要。
先到这里,后面还有比如分布处理效应、间接处理效应等等。
群友可在社群中下载该文PDF版本。
关于Stata
, 1.
Stata16新增功能有哪些? 满满干货拿走不谢
,2.
Stata资料全分享,快点收藏学习
,
3.Stata统计功能、数据作图、学习资源
,
4.Stata学习的书籍和材料大放送, 以火力全开的势头
,
5.史上最全Stata绘图技巧, 女生的最爱
,6.
把Stata结果输出到word, excel的干货方案
,7.
编程语言中的函数什么鬼?Stata所有函数在此集结
,8.
世界范围内使用最多的500个Stata程序
,9.
6张图掌握Stata软件的方方面面, 还有谁, 还有谁?
10.
LR检验、Wald检验、LM检验什么鬼?怎么在Stata实现
,11.
Stata15版新功能,你竟然没有想到,一睹为快
,12.
"高级计量经济学及Stata应用"和"Stata十八讲"配套数据
,13.
数据管理的Stata程序功夫秘籍
,14.
非线性面板模型中内生性解决方案以及Stata命令
,
15.把动态面板命令讲清楚了,对Stata的ado详尽解
,16.
半参数估计思想和Stata操作示例
,17.
Stata最有用的points都在这里,无可替代的材料
,
18.PSM倾向匹配Stata操作详细步骤和代码,干货十
足,19.
随机前沿分析和包络数据分析 SFA,DEA 及Stata操作
,20.
福利大放送, Stata编程技巧和使用Tips大集成
,21.
使用Stata进行随机前沿分析的经典操作指南
,22.
Stata, 不可能后悔的10篇文章, 编程code和注解
,23.
用Stata学习Econometrics的小tips, 第二发礼炮
,24.
用Stata学习Econometrics的小tips, 第一发礼炮
,25.
广义合成控制法gsynth, Stata运行程序release
,26.
多重中介效应的估计与检验, Stata MP15可下载
,27.
输出变量的描述性统计的方案
,28.
2SLS第一阶段输出, 截面或面板数据及统计值都行
,29.
盈余管理指标的构建及其Stata实现程序, 对应解读和经典文献
,30.
Python, Stata, R软件史上最全快捷键合辑!
,31.
用Stata做面板数据分析, 操作代码应有尽有
,32.
用Stata做面板数据分析, 操作代码应有尽有
,33.
没有这5个Stata命令, 我真的会活不下去
!,34.
第一(二)卷.Stata最新且有趣的程序系列汇编
,35.
第三卷.Stata最新且急需的程序系列汇编
,36.
第四卷.Stata最新且急需的程序系列汇编
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
7年,计量经济圈近2000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题
,
Econometrics Circle
计量经济圈组织了一个计量社群,有如下特征:
热情互助最多
、
前沿趋势最多
、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。