专栏名称: EconPaper

非线性DID模型——CIC模型的识别

EconPaper · 知乎专栏 · · 2016-01-31 23:55

正文

双重差分模型（DID）是实证经济学中非常常用的一个方法。如果对DID模型不熟悉，可以看我的专栏文章： http:// zhuanlan.zhihu.com/jing jixue/19793523 作为简要的介绍。

然而实际应用中，双重差分模型却有着非常强的假设。一个最为重要的假设是所谓的「common trend」假设，即控制组和处理组在没有经过处理的时候，其结果变量的趋势是一样的。

但是如果仔细想一下，双重差分模型对于结果变量的变换不是不变的。一个简单的例子是，如果关心的结果是收入，A的收入为1w，B的收入为2w。如果我们拿收入水平作为y，那么双重差分模型的潜在假设是收入增长的幅度是一样的，比如下一期A的收入如果变成了1.5w，B的收入应该为2.5w。而如果我们假设ln(income)作为y，那么如果A的收入变成了1.5w，B的收入应该为3w。所以在不同的设定下，common trend假设对任意单调变换是不可能同时成立的。

那么有没有可能对DID模型进行非线性甚至非参数的扩展呢？Susan Athey以及Imbens 于2006年发表在Econometrica上的文章《Identification and Inference in Nonlinear Difference-in-Differences Models》讨论了DID模型的非参数扩展——Changes-in-changes模型。

这篇文章内容非常丰富，分别讨论了CIC模型的识别、推断、与Quantile DID的区别、对离散结果变量的推广等等问题，限于篇幅，在这里我只介绍文章最核心的思想：CIC模型的识别。

假设可以观察到i.i.d 的三元组（Y, D, T），其中Y为结果变量，D为区分控制组、实验组的indicator，T为时间的indicator，I=D·T 为处理的indicator，观察到的Y实际为：

其中Y^N为没有经过处理的潜在的Y，而Y^I为经过处理的潜在的Y。假设未处理的Y其数据生成过程为：

且h为u的单调增函数。对比一下DID模型，实际上假设了：

如果设U=G+ε，那么DID模型就成了以上CIC模型设定的特例，而CIC模型的假设给位一般化。

CIC模型的关键假设是，给定分组G，不可观察的变量U是时间平稳的，即 U⊥T|G ，而DID模型实际上假设了ε不仅仅在时间上是平稳的，而且与G也是不相关的。此外，为了达到反事实的分布函数的完整识别，还必须假设U_1的support包含于U_0的support之内。

计Y^N，Y^I，Y，U给定g, t的分布函数分别为：

文章的一个关键结论是：

注意Y^N_11的分布函数是我们看不到的，而其他三个分布函数都可以从数据中得到。从而，使用三个可以观测到的分布函数，这个公式得到了观察不到的Y^N_11的分布函数。这个结论的证明也相对简单，感兴趣的读者可以参考原文，而文章中提供了一幅图可以直接显示清楚：

过程是这样的。对于一个处理组第0期的y（下图中的y），我们可以找到控制组的对应的第0期的y值，及其分布函数值（q'）。由于假设了Y^N对U是单调的，且给定G，U与T是独立的，因而可以直接找到q'对应的控制组第1期的分布函数对应q'的点，其对应的y'与y的差值就是给定U控制组的y的变化大小，从而得到了处理组在第1期的conterfactural。下图的白线即为得到的处理组第一期的反事实分布。

非线性DID模型——CIC模型的识别

正文

请到「今天看啥」查看全文