所有计量经济圈方法论
丛的code程序
, 宏微观
数据库和各种软
件都放在社群里.欢迎到计量经济圈社群交流访问
.
鉴于诸多学者对经济学研究的困惑与忧虑,不妨看看上交陆铭教授关于实证研究的观点,特别是他对实证研究与理论之间关系的见解。
我今天站在这里讲实证的课,我会跟大家鼓吹实证有多重要,但这并不意味着理论不重要。有一次上课,有一个同学听见我讲了这句话以后就问,陆老师,你实证重要,到底理论重要还是实证重要?我说,现在还有人问这样的问题啊?如果有个人告诉你,理论比实证重要,你就把他当疯子就可以了。理论和实证都重要,我今天讲实证重要,并不意味着理论就不重要了,相反,理论非常重要。那么理论和实证之间到底有什么样的关系呢?我先讲两句话给大家听听,这话都不是我的话,是别人说的,我来转述一下。
第一个是我的同学,现在在加拿大女王大学,丁维莉。她有一次讲到一句话,她说我为什么把实证研究来作为我职业的选择呢?因为有一次在开国际会议的时候,有两个搞理论的人争得不可开交,后来有一个实证经济学家说你们别吵了,我给你们看看证据,于是理论经济学家就不吵了。她说从那以后她就坚定了自己做实证经济学的信心。
还有一个就是我刚讲到的我的一个学生,现在在鲁汶大学,叫纪月梅。这次寒假的时候,我也跟她讲,面对很多来自于学生的困惑,就是学生不重视实证,觉得实证很简单,很好做,理论做不了再做实证。她现在做理论,但她在听我讲这句话时眼睛充满了惶惑,她心想复旦的学生怎么会这样,然后她就讲了这样一句话,“我觉得实证经济学家应该多看理论文章,而理论经济学家应该多看实证文章”。
为什么呢?大家想想看,什么叫经济学?我借用王永钦老师的一句话说,经济学理论不在于创造,而在于发现。经济学家有没有这样一个本事,说我们来创造一个理论?经济学家没有这样的本事,他们的本事在于发现现实生活当中存在的规律是什么?那么什么是规律呢?规律无非就是去解释,x为什么会导致y?那么在这之前,你首先要知道x导致了y,于是你才去解释为什么x导致了y。所以实证经济学对于理论来讲,就可以帮你提炼出在这个世界上所存在的事实。
就在这个礼拜二,在图卢兹读博士的李婷到我们学院来做seminar,她是做理论的,她说,“我这次回来,觉得在中国可以做的东西太多了,我每天看报纸看新闻,我就跟我妈讲,好多事情都可以做一篇文章。”她讲的是什么意思?其实理论经济学家的灵感是来自于对现实的观察。报纸是一种观察,电视也是一种观察。而实证经济学家可以做的是提供一种更加科学的,可以被大家确信的观察,如此而已。计量经济学家基于大样本的数据和科学的方法所得到的结论,更加可信,如此而已,所以他可以给理论经济学家提供事实基础。
我刚才讲了实证对于理论为什么重要,那接下来要讲的是实证也必须要基于理论。这里我就要反驳大家一种观点:你们看大量的计量文章的时候,看到的是计量经济学家把10几个变量往方程右边一摆,就出结果了,反正stata都会自动报,在写文章的时候就说x和y正相关,x和y负相关,就ok了,不是这样的。
实证研究必须基于理论;第二个方面,就是避免datamining;第三,──可能这话稍微有点过分,──对于理论经济;接下来要讲的问题就是,数理的模型和计量之间的关系;第一,理论已经有了,可以直接去检验,这个时候你的;第二,我们已经有足够的互相竞争的理论,我们就去检;第三,如果机制已经非常清楚,并不需要什么东西都写;第二个例子,大家知道在现实世界中有所谓居住区的实证研究必须基于理论。当然我这里讲的基于理论并不一定是指基于那些已经发表的数学模型的理论,不是这个意思。
你在做实证研究的时候,一开始,从变量的选取到变量的度量,再到模型的设臵,都必须要基于理论,或者说得更通俗一点,必须要有理论基础,要能说出为什么,否则你要提高计量方程的R2非常容易,就一次项放了放二次项,二次项放了放三次项,三次项放了放四次项,……可是有什么意义?如果这样去做计量,没有意义。在放每一个高次项的时候,为什么变量间是这样一个关系,我们根本不知道,因为现在的经济学理论如果告诉我们变量之间有一个非线性的关系,通常在二次项的时候就停止了,很少有人告诉你还有三次项的关系。
第二个方面,就是避免data mining。你们以后在作实证的时候会发现,经常会碰到这样的情况,一个结果出来以后发现跟事前预期不对,有的时候是不显著,有的时候是你以为是正的,结果出来是负的。有一种做法称之为data mining,就是试,不断的试,不断的加变量减变量,不断的增加二次项三次项,或者减掉二次项三次项,再加个log项,然后再加个交互项,然后把数据的度量从FDI变成trade,……从这个意义上来讲,做计量的人都知道,计量可以帮你得到你想得到的任何结果,这就是data mining。如果计量都这么做,那太可怕了,那我们就不要去做计量了,事先就已经知道结论了。
那么怎么来避免data mining呢?在具体做计量之前,你已经有一个理论的判断,然后再去做一个计量,一时发现得到的结果跟理论判断不一样,这个时候你要小心,你首先要去想为什么?是什么地方出了问题?之后再把问题找到,根据你找到的为什么会出现问题的原因再去调整你的模型和数据,这就不是data mining。在实际操作的过程中,data mining和我讲的根据理论判断去调整数据和模型之间的界限是很模糊的,但只有严格按照理论的指引得到的结果才是经得起检验的。在现在的学术制度下,你如果只是凑结果,而犯一些非常明显的错误,是不可能发表成果。
第三,──可能这话稍微有点过分,──对于理论经济学家,你可以片面而深刻,但对于实证经济学家来讲,必须全面,而且悉心洞察现实。大家知道做理论, x和y之间的关系或者相关性,有很多种可能。对于做理论的人来讲,其实他们的工作就是讲一种可能的机制就行了。如果你希望自己的模型复杂一点,丰富一点,可以多讲几种机制,但不需要把x和y之间所有的机制在一个模型里全讲清楚。
所以从某种意义上来讲,理论经济学家可以片面的深刻,但做计量经济学就不能这样了,因为当你遗漏掉一个重要的机制或者重要的变量的时候,首先就会出现系数估计的偏误。所以对于计量经济学家来讲,在想到要做一个问题,接下来要去选数据、建模型的时候,必须事先对文献非常熟悉,就是理论经济学大概做过什么,有一些什么理论?前人在做类似的工作的时候怎么设模型,怎么选数据的?之后再做自己的工作。这个时候,遗漏掉任何重要的变量和文献都是非常危险的。
接下来要讲的问题就是,数理的模型和计量之间的关系。现在有一种看法是说,计量之前要先写一个数学模型,这样才上档次,不是这样的。如果你的计量模型可以建立在数学模型的基础上,我只能说这更好,至少是好于或等于没有数学模型。但有的时候它不是一个必需的东西,而且我特别要反对的是,大家为了追求计量模型前面要有一个数学模型,就硬摆一个数学模型在那里。我碰到很多文章,前面的数学模型跟后面的计量模型根本对不起来。那么,什么时候数学的工作在计量之前不是必需的呢?我列举这样几种情况:
第一,理论已经有了,可以直接去检验,这个时候你的创新就是提供证据。比如说,在理论上,在美国教育经济学界,大家都认为学校间的竞争有利于提高学校的效率,于是会对学生的表现有正面的影响,理论上大家都认为是这样,但事实上是不是这样呢?你不需要有数学模型的,只需要直接去检验就行了。而且现在在做的这方面的工作都没有数学模型,这也成为教育经济学研究的前沿问题。
第二,我们已经有足够的互相竞争的理论,我们就去检验一下到底哪个理论更重要?比如我刚才讲的,我们自己也做的,不平等和增长之间的关系。有人讲是正的,有人讲是负的,那我们把它们放在一起,看看到底是正是负。有人讲短期是正的,长期是负的,那我们也把它们放在一起,看看短期和长期是不是有这样的差别。
第三,如果机制已经非常清楚,并不需要什么东西都写成数学模型,数学模型是帮助我们看人脑可能看不清楚的机制的。如果人脑的思路已经够清楚了,就不需要数学模型了。比如说,在social economics 或者教育经济学里面有这样一些课题非常热,第一个是peer effects(同群效应),说的是你的成绩受到你同学的影响。比如在同学中会看到喜欢学术的往往是同一个寝室的,大家相互影响就都喜欢学术了,喜欢打电脑游戏的也住在一起,这就是peer effects。
那么这个东西我们是不是要用一个数学模型去写,为什么喜欢游戏的人会影响到周围的同学呢?对于做实证经济学的人来讲,大家都觉得这件事情可能是存在的,我只不过是去identify到底是因为人们住在一起以后才受到了peer effects,还是相同类型的人事前就选择住在一起。对于实证研究来讲,更重要的是这个问题。
第二个例子,大家知道在现实世界中有所谓居住区的分割,就是穷人和穷人住在一起,富人和富人住在一起,然后有人就说,当存在social interaction的时候,由于穷人和穷人在一起,大家都相互有负面的影响,富人和富人在一起互相也有负面的影响。于是穷人的人力资本的积累就减慢了,他们的失业概率就提高了。可是这里面就碰到实证上一个很大的问题,你观察到的这种现象到底真的是因为social interaction导致的,还是事先对人力资本都不偏好的穷人选择住在了一起?这也是我们不知道的。
这个东西需不需要数学模型呢?对于实证经济学家来讲也可以不写,因为更重要的是去identify到底是哪种情况导致的?人和人住在一起就会相互受影响对于实证经济学家来讲不需要去写数学模型。
第三个我要举的例子就是social multiplier。大家知道在经济学很喜欢乘数,比如凯恩斯乘数,就是一点点货币政策、财政政策可以通过凯恩斯乘数放大。现在社会经济学的发展里面就提出这样一个新的概念叫social multiplier。就是说如果人和人之间的相互影响是存在的话,那么一点点政策的效果就可以通过人和人之间的相互影响而不断放大。比如上海市有一个项目叫“百万人学礼仪”,就是政府投入一笔钱来让大家提高礼仪修养。
大家想,你学了这些礼仪之后回到你的社区或者同事里面,你可能就会影响到他们,大家会觉得怎么这个人穿得好了或者吃饭的样子好了,他就会来学你。那么这种效应不需要通过政府的政策实施就会存在,所以你在去评估整个政策效果的时候,你看到的是最终效果,这个最终效果除以政策直接作用的那个人的效果就是这个social multiplier的大小。在实证上这个social multiplier到底存在还是不存在?到底有多大?这个也成为实证研究上非常前沿的课题,这个也不需要数学,因为我们都知道这个事情要么存在要么不存在,就通过人和人之间的互动就产生了。
在有一些研究课题里面,实际上经济学家已经出现理论经济学家和实证经济学家的分工,就象物理学家已经分工为理论物理学家和实验物理学家。这个时候如果你的比较优势是在实证方面,你不需要去做理论经济学家应该做的那些工作。因为在某些研究领域里面,理论经济学家所用到的那些工具和实证经济学家所用到的工具相互的进入成本是非常高的。
我举个非常简单的例子,social network。社会网络的计量有一套方法,但是对于社会网络的形成的数理建模用到的数学工具是图论。我不知道什么是图论,我只知道这个词。在我做的工作里面,我也会去做social network的形成和影响。但我要去做social network是如何形成的理论工作,对我来讲就是找死了。所以像这样的领域里面,你进入的时候就应该清楚你想做什么样的经济学家,这并不意味着那些会用图论的就比那些不会用图论的更加高明和聪明。因为对于那些做理论的人来讲,他也不知道这些东西到底在现实里有没有。这时候你要定位自己是一个实证经济学家,你就大胆去做就好了。
关于多期DID或交叠DID: 1.
DID相关前沿问题“政策交错执行+堆叠DID+事件研究”, 附完整slides
,2.
交错(渐进)DID中, 用TWFE估计处理效应的问题, 及Bacon分解识别估计偏误
,3.
典范! 这篇AER在一图表里用了所有DID最新进展方法, 审稿人直接服了!
4.
最新Sun和Abraham(2020)和TWFE估计多期或交错DID并绘图展示结果!详细解读code!
5.
多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习
,6.
多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等
,7.
交叠DID中平行趋势检验, 事件研究图绘制, 安慰剂检验的保姆级程序指南!
8.
欣慰! 营养午餐计划终于登上TOP5! 交叠DID+异质性稳健DID!
9.
用事件研究法开展政策评估的过程, 手把手教学文章!
10.
从双重差分法到事件研究法, 双重差分滥用与需要注意的问题
,11.
系统梳理DID最新进展: 从多期DID的潜在问题到当前主流解决方法和代码!
12.
标准DID中的平行趋势检验,动态效应, 安慰剂检验, 预期效应教程
,13.
DID从经典到前沿方法的保姆级教程, 释放最完整数据和代码!
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
7年,计量经济圈近2000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题
,
Econometrics Circle