识别因果关系是实证经济学的一大重要课题。自上世纪八十年代以来,实证经济学在这一方面取得了很多成绩。实证经济学家把随机控制试验和“自然”实验等多种技术应用于因果关系的识别,形成了实验主义方法。实验主义方法声称已经能够令人信服地识别变量间的因果关系,并且这种方法比其他形式的实证研究更有优势。
具体而言,实验主义方法的优势是能够识别特定情境下的因果效应,从而成功地解决了可信的经济推断中的“有无”问题。此外,其基本思路是做实验,简洁透明,一目了然。而且,其对因果关系的识别并不依赖于任何特定的经济机制,且具体的技术手段在统计上也更稳健。因而,对于那些能够采用实验和自然实验的问题,实验主义方法在统计的可靠性方面优于其他任何方法(Imbens和Angrist,1994)。总之,实验主义方法是对实证经济学的一大贡献,在诸多领域有着广泛的应用。①
不过,这种方法能否解决经济推断的另一大问题,即:能否可信地由观察到的现象推断出背后的具体机制呢?目前的研究表明,正是在这一方面,实验主义方法乏善可陈,难有作为。具体而言,有以下几点不足。
第一、由于无法识别数据背后的机制,因而不能做出有用的政策评估和福利分析(Heckman,1997;Rosenzweig和Wolpin,2000;Heckman和Urzua,2010;Deaton,2009)。
这首先表现为估计结果对“异质性”敏感。所谓异质性其实是指因果关系中含有多种机制,因而在具体情况下估计结果取决于此时何种机制居于主导地位,以及样本中哪些个体对所选择的用于识别的外生冲击做出了反应。异质性直接导致了外推有效性问题,使其政策评估能力大打折扣。比如Angrist和Lavy(1999)发现:班级规模减少10个人能提高成绩约0.2到0.3个标准差。但这个结论能否推广到中国呢?或者这个结论在中国仍是合理的吗?此外,对数据背后机制的忽视,也使其无法直接回答与福利相关的问题。仍以Angrist和Lavy(1999)为例,即便接受小班确实有利于提高学生成绩这个定性结论,由于不知道小班作用的具体机制,我们仍然无法回答缩小班级大小是否比增加教师工资以提高教学质量,或者改善学生的营养和健康状况更能有效地提高学生成绩。
第二、实验主义方法对存在策略性行为和涉及一般均衡的因果关系无能为力。可控实验与局部均衡中的“所有其他条件不变”的概念一致,由此识别的因果效应在概念上与局部效应(partial effect)完全一致。如果存在策略性行为,那么有时候变量之间的关系会随着博弈均衡的改变而发生质的变化。类似的,一般均衡考虑市场之间的相互影响,也无法做到所有其他条件不变。此时,人们对现象背后的机制更关心,而实验主义方法恰恰不能回答这些问题。
不仅如此,其在实际操作方面也困难重重。
第一、随机控制试验代价高昂,而自然实验也并不容易获得。例如,“师生成绩比率”(Student/TeacherAchievement Ratio,STAR)实验前后花费了1200万美元;国民健康保险实验的花费高达1.5亿美元。某些情况下,随机控制试验由于涉及伦理问题而不可行。因此,除非有充分的理由需要通过实验去获得相关信息,否则实验是不必要的。另一方面,为了寻找自然实验,实证经济学家不得不从最引人瞩目的研究方向转向一些微不足道的研究题目。James Heckman曾经声称:“在我们这个行当的某些地方,讨论水平已经沦落到《纽约客》文章的水平了”。①举例来说,在劳动经济学中不少有影响的或者有说服力的自然实验研究,由于受到上述限制,在许多重要问题上仍未达成广泛一致,成就有限。Keane(2010)发现:通过实验主义方法或多或少达成一致的结果仅有寥寥5项:(1)Frisch工资弹性大约等于1;(2)邻居的好坏对收入没有影响;(3)小班能提高学生的表现;(4)死刑不改变谋杀率;(5)服兵役减少了退伍后的收入。这说明实验主义方法关注的是具体案例,积累具有普遍学术价值的结论的速度较慢。
第二、实验与自然实验方法在操作中也困难重重,难以保证满足实验所要求的条件。比如,在随机控制试验中难以做到真正的随机。例如Miguel和Kremer(2004)在利用实验研究蛔虫对入学率的影响时,按照学校名称的字母顺序将学校“随机”地分组。但这并不是真正的随机化,因为政府或非政府组织分配资源时,也可能按照字母顺序分组。因而,入学率的变化有可能并非完全源于实验干预,还有可能源于其他资源的差异。另一个例子是Angrist(1990)使用征兵“彩票”号码作为工具变量分析越战对退伍士兵收入的影响。这个工具变量并不能完全解释当事人是否会服兵役,因为一个抽到签的人是否去参军还取决于其机会成本。如果服兵役的代价过高,有些人会千方百计地逃兵役。在关于班级大小与学生成绩的研究中,Urquiola和Verhoogen(2009)的研究也表明存在当事人根据机会成本选择不同班级的情况。
在宏观领域,识别因果效应就更加困难。Rigobon(2003)提出了一个创新的识别方法,用向量自回归模型中的方差突变作为外生冲击解决识别问题。但是,这种方法也有类似弱工具变量的困难。又比如,在研究外援对经济增长的影响时,Boone(1996)提出的方案为很多后续研究所沿用。他建议用人口的对数作为外援的工具变量,理由是在简单增长模型中人口与经济增长无关,所以人口越多,得到的人均援助就越少。但在这里,对工具变量独立于误差项的解释并不令人信服。
综上所述,实验主义方法与结构性实证研究的主要分歧在于实验与自然实验结果是否可以用于政策评估。政策评估的目的是发现某项政策起效的机制,以便将来不同的情形下斟酌使用,因而不仅要求知晓政策有没有效果,而且需要知道其背后的机制。实验主义方法虽然可以识别因果效应是否存在,却不能识别其背后的“因果性机制”,人们需要基于经济学理论的结构性实证研究来讨论这些问题。尽管目前结构性实证研究仍有很多缺陷,不像实验主义方法已经有了成熟稳定的做法,不过它仍是辨识出“因果性机制”的希望所在。实证研究中,实验不能代替理论。