一、审计实验的核心思想、实施程序
所谓审计实验方法,实际上就是采取角色扮演的方式来构建一个研究现场,通过角色和现实当中的行为人之间的社会互动,来生成相关的数据集,并通过该数据集研究各种社会经济问题。审计实验法在发展过程中出现了两种形式:书信形式和人物形式。书信形式指的是通过文书传递来实现市场双方的互动(信件实验)。例如,求职者通过投递个人简历与雇主之间互动。人物形式强调的是通过活生生的人和人之间面对面的互动进行实验(审计实验)。这两种方法除了媒介不同,在研究理念上完全一样,都是通过调整检测员(tester)的特征来考察市场另一方可能做出的不同应对。因而,很多文章将这两种形式都归为审计实验法,作者也采取这一口径。
审计实验法的主体程序包括三个步骤:(1)设计出两个其他方面都相同但仅在某一方面存在差异的个体作为检测员(tester);(2)让两个检测员与实际存在的另一方市场主体进行互动,互动可以是面对面地或者通过文书进行。另一方主体在整个过程中是不知情的,不知道实验在进行,否则他们可能会改变行为。(3)收集互动的信息,并分析这两个在某方面存在差异的个体是否受到差别对待。在这三个步骤中,第一个步骤是审计实验法的核心环节。如果两个个体其他方面都相同,那么就可以排除其他可能要素的影响,把互动环节可能产生的差异归因于那设定的差异。“仅在某一方面存在差异”是一个简单说法。有些时候,一个研究同时考察几方面因素的影响,譬如种族和性别,那么就会在多个方面上设置差异。
二、审计实验设计的关键环节
对审计实验法来说,技术面包含三个最关键的要素:检测员的差异性(仅在某一方面存在差异)、同质性(其他方面都相同)和普遍性(贴近现实、代表一般水平),这三个方面存在着既相互促进又彼此制约的关系。
1. 关于差异性的设计
在审计实验中,检测员的差异性必须能够合情合理地表达出来。有时候,检测员的差异性表现为种族、性别等先天特征,而有时候,差异性表现在后天特征上。人物形式还是书信形式也会影响到具体设计。
举例1:玛丽安·贝特朗和森黑·穆勒内森(2004)设计了书信的形式,通过发送白人和黑人的求职简历并对比不同简历收到的面试邀请,探讨就业市场上的种族歧视问题。差异性体现在两个求职者除了种族不同外,其他各方面条件几乎完全相同。由于美国的求职简历通常都不注明种族(不像我们会注明民族),研究者必须设法在符合常规做法的情况下,彰显某个简历是白人的还是黑人的。他们采取的是用具有鲜明种族特色的名字彰显求职者的种族特征。具体做法是,首先根据使用频率从出生记录数据里预选出一批较多用于白人的名字和较多用于黑人的名字;然后,在街头做了一些访谈,测试这些名字的种族特色是否广为认可,剔除掉公众认可度低的名字。这样,当雇主看到简历时,如果他在乎种族特征,那么雇主基本上能准确地鉴别出这是白人还是黑人了。
如果研究关注的要素并不直接可见,设计差异性则需要一些技巧。举例2:亨利·施耐德(2012)研究声誉对汽修行业里代理人的影响问题时,涉及了人物形式(以修车者为tester)的审计实验。考虑到修车者是否居住在当地直接影响修车工人对声誉的重视度,研究者通过变化修车者是否居住在当地来设定声誉要素的强弱。在弱声誉下,修车者对修理工人说,他在两个星期之后将搬家到别处,并且在车子里放上很多强化他即将搬家的盒子袋子;在强声誉下,修车者说他在两个星期之后将出去旅游。如果被询问家庭地址,研究者准备了两个地址,弱声誉下强调外地地址,强声誉下给的是本地地址。
2.关于同质性的设计
除了在设定具有差异性方面之外,检测员的其他方面必须非常相似,否则就不能排除其他方面的差异对结果的解释。同质性的设计存在很多挑战,这是一个细节决定成败的环节。我们接下来讨论如何在显性要素上消除差异,以及如何消除市场另一方主体可能推断出的差异性。
对于书信形式的审计实验,仍以贝特朗和穆勒内森(2004)的种族歧视研究为例。种族特征的载体是简历上的名字,所以同一份简历配上不同的名字即可代表不同种族的求职者。同质性不代表两个求职者发送除名字外完全一样的简历,否则雇主会疑惑。为了实现同质性,可以随机的把若干简历和姓名匹配,一个雇主收到来自白人和黑人的两份简历未必完全可比,但是雇主这个群体收到的来自白人和黑人的简历却是一样的。当然,如果采用的若干简历模板质量相当,在同一个雇主那儿也具有可比性,效果会更好。大多数采用书信形式的研究都是以随机匹配来获得同质性。
对于用人物形式考察非天生特征的研究,同一个检测员可以扮演几种不同角色(即承载若干具有差异性的特征),把检测员和不同角色随机搭配,有助于实现同质性的要求。仍以施耐德(2012)的声誉研究为例,同一个检测员可以声称将要搬走或者住在本地,因而保持道具汽车的一致性和检测员着装和言行的一致性就可以实现同质性。审计实验法的典型设计要求两组人车随机地扮演角色去同一个汽修店。但由于资源的局限,只有一辆车参与实验,施耐德本人扮演修车者,两次同样原因去同一个汽修店会显得奇怪。因而,研究者对汽修店做随机安排,即把有的汽修店随机安排了高声誉情境而有的则是低声誉情境。
如果采用人物形式来研究种族和性别等生理特征的影响,在同质性的设定上挑战会更大。在艾尔斯和席格曼(1995)研究种族和性别对购车中讨价还价的影响时,种族和性别特征是完全依附于个体,同一个购车者很难在某种场合扮演黑人男性,在另一场合冒充白人女性。但所谓的同质性也只能是不同种族和性别的购车者在一些重要方面能够比较好地匹配,所以,研究人员在年龄、学历、相貌、穿着和出行工具等方面对检测员进行匹配,即可完成同质性设计。特别是销售人员可能会从种族上推断黑人经济状况不佳等等,因此,在穿着、租车、职业和居住几方面的设定都一定程度能够显示所有购车者具有相当的经济背景。为了更有效地传递购车者有足够的经济能力,所有购车者要求在讨价还价之前向售车者表明他不需要贷款。
最后,人物形式的实验涉及面对面的交流,保持交流过程的同质性非常重要。这就需要研究人员事先制定一个交流的脚本,囊括交流过程中既定的步骤、可能出现的各种问题以及如何应答。检测员需要反复背诵、练习脚本,进行模拟实验,以实现同一检测员行为的可重复性以及不同的检测员的行为之间的可比性。
3.关于普遍性的设计
研究总是希望能够对社会生活的普遍现象做一些描述或说明,但实验类研究往往受资源的约束在样本选择上相对局限。为了使样本具有普遍性,一般有两种做法:一是使样本更接近于社会平均状况;二是在某些维度上增加样本的种类以增加其代表性。
举例:在通过投简历考察招聘市场上歧视的研究中,(1)为了使简历真实而又具有代表性,研究人员往往从现实挂在求职网站上的简历入手炮制实验中的简历,这样可以和市场上一般求职者最为接近。此外,在地区选择、职业类型以及简历质量上也尽量广泛。(2)在差异性的设计中,为什么不直接在简历上标注种族信息呢?这就涉及普遍性的问题。在其他求职者都不标注种族信息的普遍情况下,标注种族信息不仅传递了种族信息,还可能传递出其他信息。因而,在这方面,遵从普遍性的原则有利于实现同质性。(3)为了较好地匹配白人和黑人的外部特征,研究者对年龄和学历做了约束性的限制。同时,为了排除经常伴随种族特征的经济状况的差异,所有的检测员都透露出有钱人的气息。这些基于同质性所做出的限制显然约束了研究结果
的普适性,但研究人员试图从其他方面来增强结果解释上的普遍意义。譬如,挑选看起来中等长相的检测员,采用两套不同的讨价还价方式(对比主要还是在同一讨价还价方式下白人和黑人之间进行的)。
三、审计实验的优势、局限及措施
和传统的回归方法相比,审计实验法的优势在于解决遗漏变量偏误。试想用传统的回归方法研究劳动市场的种族差异问题,难以避免很多影响录用的因素在回归中没有控制住,因而会导致遗漏变量偏误此外,即使白人和黑人在被录用的潜质上相似,但如果黑人不积极找工作的话,雇佣上的差异也不可以解释为雇主方面的歧视问题。审计实验法的突出优势就是它在设计上强调“其他方面都相似但仅在某一方面存在差异”,排除了其他因素对录用差异的解释。通过呈现两个其他方面都相似的检测员,审计实验法可以直接考察市场另一方主体歧视的行为,而不是通过某些结果推断歧视。
但审计实验法在运用的过程中招致了一些批判。(1)关于有效匹配的问题,即检测员有多个方面的特征,是否扮演不同角色的检测员在各个方面都匹配上了。实际上,在书信形式的研究中以及在人物形式但是考察非自然属性的研究中,匹配问题并不突出,因为把检测员和所要研究的要素随机搭配起来就可以了。对于用人物形式考察种族性别等自然属性的研究,如果研究人员在设计实验的时候多方面考虑各种情况,尤其和若干潜在研究对象进行深度访谈了解他们的思维,就有可能采用一些手段减少隐性要素上的差异性。(2)实验过程中有意或无意的行为差异。这个批判主要针对人物形式的研究,如果检测员了解研究目的,那么在实验中他们可能有意或无意地在行为上有所不同,使得结果趋向预期。应对的办法大致有三:一是不告知检测员
研究目的;二是通过大量的模拟和练习降低行为上的差异;三是选取不易受检测员的行为影响的观测结果作为研究对象。(3)夸大了问题的严重性。这个批判主要针对就业市场中歧视问题的研究,因为影响求职者资质的重要因素都匹配好了,雇主就不得不在次要因素上进行抉择。对于这个批判的反驳主要是,大多数的研究考察招聘的早期决策,即是否邀请某求职者进行面试,这往往不是二选一的决定,雇主不需要在次要因素上进行抉择。其他运用审计实验法的研究中就更不存在这方面的问题。比如,白人买车或者黑人买车之间根本不存在竞争性。(4)研究的广度和深度具有局限。对这个批判的回应是,审计实验法考察的问题在日益扩展,从一开始集中研究歧视问题,扩展到研究声誉、医保身份、投资历史等等。(5)道德问题。这主要有三个方面的问题。一是审计实验法的研究过程中带有欺骗的成分,欺骗本身就是个问题。设计的求职者并不真心想求职,购车者并不真心要买车,修车者没打算真正修车,求医者也并不真正看病。二是这些研究活动占用了一些市场另一方行为者的时间,但却没有(足够地)补偿他们。三是研究的结果多半是揭露市场另一方行为者的不良行为,有可能会使后者的名誉受损。第一方面的问题难以作为,后两方面的问题则可以尽量减少或避免,其原则是降低对个体的损害。
四、审计实验研究的进展、未来和展望
审计实验法最初是从房地产市场上的研究里发展出来的,研究房地产市场的歧视问题(W.Daniel,1968;J.Yinger,1986)。随后,关于歧视问题的研究延伸到商品交易(如汽车、运动卡等)市场(A.Ayres and P. Siegleman,1995;J.List,2004)和劳动市场(R.Jowel,1970;M.Bertrand and S.Mullainathan,2004;Riach and Rich,2006;K.Kroft,2013)。近些年来,审计实验法越来越多地运用在对委托代理关系的研究上,这或许将是审计实验法运用的新兴领域。前面介绍的施耐德(2012)的研究考察了声誉对汽车修理中代理人问题的影响。詹妮·居里、林莞娟和王威(2011)探讨了患者的知识对医生开处抗生素的影响。陆方文(2014)研究了医疗保险状态和经济激励对医生开处方行为的影响。森黑·穆勒内森等(2012)考察了咨询对象的投资历史对投资顾问给出投资建议的影响,指出投资顾问倾向于增强咨询对象的投资偏误。
目前在中国经济学界还没有引入审计实验法,基于中国的社会经济现实展开的相关研究也很少。出现这种状况的原因主要有两个:一是国内学者对审计实验法的研究方法还不了解;二是审计实验法的一个传统研究领域——就业市场上歧视(在中国更多地表现为性别歧视)太显然,很多雇主甚至公开承认歧视的做法,使得审计实验法没什么必要。但就审计实验法本身来说,其应用范围远远不止歧视这一个问题,在几乎所有公共领域以及发展过程中的相关社会问题上,这一方法都有其应用的价值。比如,医患关系紧张、抗生素滥用、医药费用飙升是社会热点话题,也是亟待解决的国计民生问题。审计实验法在这方面的研究中大有作为。虽然有大量的文章研究抗生素滥用问题,但是观测数据很难回答这是医生导致的还是患者需求的。詹妮·居里、林莞娟和王威(2011)设计了一个审计实验,实验结果清晰地表明,医生主动开列抗生素是其泛滥的重要原因,普及一些基本用药知识可以显著地降低抗生素的使用。关于医药费用,当大多数实证类文章运用观测数据致力于探讨医疗保险是否增加医药费用时,陆方文(2014)通过审计实验法不仅指出医疗保险的确会导致医药费用增加,即使在患者不主动要求用药的情况下,医生也会给有医保的患者开出更大的处方,而且还考察这一现象的原因——医保增强了患者的支付能力使得医生有更大的空间去拿提成。
总之,运用审计实验法需要技巧,以更大程度地发挥实验法研究的价值。从这些研究可以看出,相比现有的基于传统研究方法的文献,审计实验法具有独到之处,并且能够挖掘很多社会事件背后的真相,这对于我国今后的社会经济转型和政策设计来说尤为重要。
主要参考文献
周业安,2016,《实验治理:一种新的治理范式》,《社会治理》第3期。
M.Bertrand and S.Mullainathan,2004,Are Emily and Greg More Employable than Lakisha and Jamal?A Field Experiment on labor Market Discrimination.The American Economic review,94(4):991-1013.
K. Kroft et al,2013,Duration Dependence and Labor Market Conditions:Evidence from a Field Experiment, The Quarterly Journal of Economics,128(3): 1123-1167.
Fangwen Lu,2014,Insurance Coverage and Agency Problems in Doctor Prescriptions: Evidence from a Field Experiment in China, Journal of Development Economics ,106(1):156-167.
H.S.Schneider,2012, Agency Problemsand Reputation in Expert Services:Evidence from AutoRepair, Journal of Industrial Economics,60(3):406–433.