专栏名称: EconPaper
目录
相关文章推荐
萧秋水  ·  养老社区参观记:深业颐居 ·  17 小时前  
界面新闻  ·  比亚迪A股股价再创新高 ·  昨天  
纯银V  ·  入室抢劫爱情专案组 👧❤️ ... ·  2 天前  
界面文化  ·  大声谈论“更年期” ·  2 天前  
界面新闻  ·  英特尔新任CEO拟全面改革芯片制造和AI业务 ·  2 天前  
51好读  ›  专栏  ›  EconPaper

多而无效工具变量下的识别与推断

EconPaper  · 知乎专栏  ·  · 2015-12-20 00:40

正文

工具变量一直是计量经济学中「因果推断」的利器,然而在实际应用中,总会有这样活着那样的问题。传统来讲,工具变量有两个要求:与内生变量高度相关、与误差项不相关,这两个要求缺一不可。前者的违背会导致弱工具,这其中一个更有意思的问题是有很多的弱工具(many weak instruments)的情况。而后者的违背会使得工具变的无效(Invalid)。

那么,如果这两个问题一起遇到呢?也就是many invalid instruments?

由五位大神: 普林斯顿的 Michal Kolesar、哈佛的Raj Chetty、John Friedman、Edward Glaeser以及斯坦福的Guido W. Imbens 在《Journal of Business and Economic Statistics》上的文章《Identification and inference with many invalid instruments》讨论了当有这些问题时一种特殊情况的识别与推断。

作者先举了一个实际的例子。在之前Chetty et al. (2011)的文章中,作者对早期教育非常感兴趣。作者想知道,幼儿园时期的成绩是不是对一年级的成绩有影响。由于幼儿园时期的班级是随机分配的,因而这个分班就很资产的成为了幼儿园成绩的工具变量。

然而问题是,这样做有一个很大的弊端,就是从幼儿园升学之后,这些小朋友绝大多数都还在一个班。如果这样,幼儿园的分班情况就不仅仅影响了幼儿园的成绩,还 直接 影响了一年级的成绩。因而这个工具是invalid。

除此之外,还有一个更麻烦的问题是,由于每个班的学生数不会超过某个数值,所以随着样本量(学生数)的增大,班级的个数也在增大,这就导致了many instruments。此外,由于分班情况还影响了一年级的成绩,因而也有了many regressors的问题。

一般的研究人员也许会有两个策略:忽略掉幼儿园分班情况对一年级成绩的影响,直接做,当然,这样做是不对的;要么会说,这个工具不对,不能做。

可是大神就是大神,即便有这么多问题的情况下,他们还是想办法做出来了。怎么做的呢?

虽然幼儿园的分班情况跟一年级的分班情况几乎相同,但是一年级的老师却又是随机分配的。所以幼儿园分班情况对幼儿园的成绩的影响,以及对一年级成绩的影响,是 正交 的!什么个意思呢?幼儿园某个班能碰到好的老师,成绩高,但是到了一年级,因为老师随机分配,因而遇到好的老师的概率跟其他班是一样的,所以这两个影响应该是不相关的。

那么数学上怎么做呢?假设面临以下模型:

其中Y为一年级成绩,X为关心的内生变量,幼儿园成绩,W为其他的控制变量,Z为工具变量(班级的dummy)。注意工具变量直接影响了Y,而且Z的规模随着N的增大而增大。

仿照文献的做法,这里的γ和π_1并不假设为未知的系数,而是 随机变量 。那么以上的正交条件就可以表达为γ和π_1的独立。或者,将Z对W的残差与[γ π_1]的乘积的相关矩阵表示为:







请到「今天看啥」查看全文