作为与现实紧密联系的政治学,其学科内在知识的表达既包括对政治行为、政治现象的描述和归纳,也包含对其解释和预测。而后者所传递出的政治学价值更容易被公众所接受,当然,解释和预测紧密相关,在研究中也常被理解为因果效应探索。但这一研究目标在传统研究路径中并不容易实现,首先,政治行为和政治现象的发生往往由多种因素导致,故研究中常面临如此困境:仅因为X能使得Y产生变化,并不能简单认为Y在现实世界中的变化都能被X所解释,我们缺少足够的控制变量来严格保证X造成Y的变化,事实上,也可能有其他干扰项和误差等因素影响Y的变化。其次,影响特定政治行为和政治现象发生的自变量往往难以测量,目前的研究多是通过搭建中介效应变量,即探索自变量X通过中介变量M传递了某种特定因果效应。比如考察网民对网络政治议题兴趣的研究中,可以较容易通过控制网民互联网接触频率和时长、访问不同类型新闻网站等中介变量来予以分析。
然而,随着自变量和中介变量的增加,在所有的社会科学模型中,几乎不可避免地存在着共线性的问题,此时研究者很容易得到错误却貌似可靠的因果关系,并错误地指定相关变量作为因果机制建立的决定性要素。在政治学实证研究中,这类错误广泛地存在于线性回归、聚类分析和主成分分析等方法应用的成果上。随着研究技术的发展,在社会科学不同学科研究方法相互交叉相互学习不断深入的背景下,经济学、心理学等领域发挥重要作用的实验方法被政治学者所关注。当然,政治学一直以来作为学科方法发展的被动接受者,对其他学科方法的吸纳借鉴也伴随着各类水土不服的现象并存在各种争论和困惑。下文将对实验方法在政治学研究中应用的兴起过程、当前所面临的争论和困惑及未来发展前景进行初步的探讨。
一、政治学实验方法的兴起
在社会科学不同分支中,政治学科并不像经济学、社会学那样容易就某一理论达成共识,更别提就某一研究方法达成共识。学科内部缺乏中心凝聚性,一方面形成学科研究方法常处于争论的焦点,另一方面,却也有利于去开放地借鉴不同学科研究内容和研究方法,发挥政治学研究方法应用的想象力。所以,政治心理学、政治生物学等新的研究主题不断涌现,学科研究方法也不断丰富。在其他学科的影响和政治学研究方法自我变革过程中,特别是在“行为主义革命”推动下,政治学研究者可以“自由地使用任何其他学科可以借鉴的方法”①,如运用经济学、社会学、心理学及统计学和应用数学等多学科的研究成果来回答新时期的政治学问题,为了更好解决对政治行为和政治现象进行具体因果机制分析等方面的实证需求,学者在定量分析方法兴起过程中也渐渐引入了实验方法。
但是,实验方法在政治学应用中并不顺利,比如早在1909年,洛厄尔(Lowell)就任美国政治科学会(APSA)主席所做的就职演讲中,认为政治学界要对实验研究保持警惕,他强调“政治的科学属性在于观察性,而非实验性的”②。这主要由于当时政治学研究主题和关注的研究对象主要是国家或次国家分析单位,实验方法显然难以实现宏大叙事对象的研究设计。所以,政治学20世纪早期因果关系探索中,一直以密尔提出的“最大相似设计和最大差异设计”等归纳路径为主导。之后,统计学发展和广泛应用所带来的行为主义革命和后行为主义革命等转变了学科的研究方法和研究对象,学界的关注点既超越了传统宏观上国家或组织政治行为,在后期还跨越了微观上个体政治行为或心理,如更强调探讨对政治角色的理解、政治情绪与政治态度的变化等现象发生的原因及结果,此时虽然统计回归等数理方法逐渐成为主流,但由于前文所提到的现实政治的复杂性,对特定政治行为或现象的发生存在诸多容易混淆的影响因素。同时,政治生活的主观性也存在诸多被忽略或无法测量的变量,如政治兴趣浓厚、政治知识多寡等变量测量。因此,如传统定量研究中的截面数据分析,很难为因果机制探索的需求建立起解释变量发生前后顺序的模型设计③。
由于因果机制研究目标的达成面临着研究方法不足的困境,不同学科方法的融合逐渐为实现对研究对象系统性检验提供新的方法思路,主要有如下三种:一是分析自变量和因变量之间的共变关系;二是少数个案的深度观察形成过程追踪;三是竞争性理论的比较检验构成同余分析。前两者侧重于理论发展的归纳路径,最后一种则是侧重于理论验证的演绎路径(见表1)。这些新的方法由于既可以实现挖掘较长时间跨度的因果过程,也可以界定特定政治现象的因果链条,进而受到广泛关注,并逐步在此基础上发展完善了政治学实验方法,其核心是通过对政治学研究对象在发展过程中不同时间段的比较,或控制不同中介变量情况下比较研究对象的变化程度,进而实现确定影响因变量的关键因素。
在实验方法兴起之后,学者借助实验设计来开展政治学议题的分析,如对投票行为、政治人的人格塑造、政治观点的形成等进行分析并取得系列成果。到1970年代之后,纽约大学石溪分校的政治心理实验室、耶鲁大学媒体对社会舆论影响的相关实验、密歇根大学政治心理实验项目、加州洛杉矶分校的政治心理实验项目等纷纷成立或开展,形成整个20世纪80年代纽约大学石溪分校、密歇根大学和加州洛杉矶分校三足鼎立的局面。到20世纪末,1996-1997年奥斯特罗姆当选美国政治学会主席,其所作就职演讲中提出,“政治学行为主义研究转向,特别是实验方法应用对政治学发展具有重要意义”④,标志着实验方法在政治学研究中的正式复苏,世界各大主要政治学研究重镇纷纷成立政治学为主导或跨学科的实验室(见表2)。
实验方法虽然引入政治学研究中并被逐步认可,但如同其他社会科学学科采纳此方法一样,政治学实验方法多半是类实验(Quasi
Experiment),并非如同自然科学那般是纯粹随机实验(Pure Randomized
Experiment)。换句话说,社会科学中实验方法实施过程并不如自然科学那般要求严格,类实验在研究设计中,实验对象的处理并不一定强调随机分布和随机开展,通常对实验对象的干预多以一种非随机的方式产生。这主要是因为学者显然对如政府新政策实施、政治宣传活动新方式的开展等研究对象无法进行随机干预和随机观察,研究者此时多是通过了解和评估新政策对部分社会个体和社会发展的影响,或者评估比较新政策对不同时间、不同地点背景下相关社会政治群体的影响。
虽然类实验设计愈来愈复杂并逐步完善,通过发展不同新的干预技术和选取对照组系统分析潜在的影响因素来界定因果机制,此时类实验的结果甚至可以和随机实验相媲美,但类实验和完全随机实验除了逻辑上的相似性,两种实验依然存在若干差距,如研究者无法保证其实验干预对每个研究对象均等有效⑤;社会科学实验中测量误差和对潜在影响因素的忽略更为常见,如对不同人群的政策干预实验中,虽然可以控制参与实验者的社会经济地位特征,但难以估计其社会生活背景和家庭因素,而这些恰恰也是影响实验结果的一部分。所以,由于政治学研究对象特征和类实验方法特征,其应用也总是遇到不同的争论和困惑。
二、政治学实验方法的争论和困惑
前文提到实验方法引入的目的是为了提高对政治研究对象的解释和预测。对研究对象的解释可以归入实验方法内部效度范畴,表明这种解释的可信度、真实性等,而预测则可以归入外部效度范畴,指某一研究结论在实验情境之外环境中的有效性。研究者为了提高内部效度往往需要控制更多的变量,这就在一定程度上限制了外部效度的扩展⑥。即实验研究中总是面临内部效度和外部效度一致性的矛盾,在提高内部效度的同时则会降低外部效度。也正因为如此,实验方法貌似复杂,其实依然是定量研究的重复,简单地说,当传统定量分析中进行一次回归研究设计时,实验方法则进行实验组和对照组两次以上的回归研究设计。但是这种重复是否有价值和有意义呢?有学者就指出,政治学研究论文“大量使用一些离政治科学领域很遥远的方法,且几乎没有证据能证明作者真正懂这些方法,然后我们会看到很多同样不堪的文章喷涌而出,其实大部分的结果都与研究主题不相干”⑦。虽然复杂的模型并不总是不恰当,在某些情境下,它们很明显要比其替代的简单模型更高级,但当前的研究中,更多是为了复杂而复杂,为了方法新颖而新颖。这显然不利于学科知识的增量成长,为了避免长期以来重方法而轻理论的研究诟病,2001年开始,美国国家科学基金试图通过强调“理论模型中的经验意蕴”(Empirical
Implications of Theoretical
Models,EITM,又被称为EITM行动)⑧来反思当前政治学研究过于强调统计分析、博弈论、形式模型等实证探索,而弱化理论建构的偏颇。美国国家科学基金实施一系列暑期学校、研究会议和奖学金等资助项目,试图实现弥补定量分析和理论建构之间愈加扩大的差距。
但这并没有减少实验方法在现实应用中所存在的若干困惑,本文将应用过程中实验方法困惑归纳如下:主要包括方法应用的目标、方法应用的过程、方法应用的结果等方面。对于这些困惑的澄清有助于未来研究方法应用中更好地与政治学理论相结合,提高研究方法应用有效性。
困惑1:实验方法的目标是推进政治学科概念的检验创新,还是推进理论的发展完善。研究者普遍遇到的困扰是如何将概念和理论相互联系起来,概念能否有效支撑理论,理论又能否有效反映出概念是一个好的研究设计的核心。政治学科研究中对概念的细化和澄清是重要的任务,概念一般而言可以分为背景性概念、系统性概念、指标性概念三个层次⑨,不同层次的概念构成理论生成的基础单位,同时,理论中的概念又受到研究情境的影响,尤其是在跨国比较研究中,在实验方法应用中,往往难以控制被实验者对特定概念理解的差异,这就难以实现概念验证和理论发展,部分学者通过尝试建立其他等价的替代变量等路径调和实验方法在政治学研究中对概念验证和理论发展之间的冲突,但是这种研究的洞察力还有待进一步观察。
困惑2:上一个困惑指出由于政治学研究中存在概念创新和理论发展的两种面向,在具体方法应用过程中,进而形成测量效度和因果效应分析在研究设计中孰轻孰重的困惑。测量效度主要针对变量中的概念而言,不同情境下的单一变量概念往往面临不同的测量效度,如同一套问卷调查中的术语在不同群体看来往往存在不同的含义,比如政治学研究中比比皆是的“普适性”、“特殊性”、“民主”等概念。测量效度通过解决研究对象指标界定、指标选择等相关概念问题,进而实现因果效应分析的可靠性,可以说,一个良好的测量效度设计是因果效应分析的基础。当然,测量效度并不一定完全取决于定量研究手段和技术,还受到研究者研究经验、研究素养、学术敏锐度等定性知识积累的影响,甚至在某种程度上,可认为这种定性知识是良好定量分析的前提。
困惑3:既然定性知识是定量研究的前提,那么实验方法是进一步拉大还是缩小定量研究和定性研究之间的差距,抑或提高政治学的门槛。定性研究者和定量研究者虽然通过不同的研究工具寻找答案,但一个普遍的共识是:其都面对政治学研究中的共同分析对象。在此共识框架中,定性与定量研究者可以从相互差异的研究工具中学习互补。而长期以来,政治学学科门槛一直面临着两种特殊的尴尬,一方面,在发展中国家或政治学研究的早期,其学科研究的学术性门槛并不高,这也就使得政治学学科的边界过于模糊并面临其他不同学科的侵蚀,但同时,这种低门槛并没有使得政治学更为广泛地被传播、被公众所接纳;另一方面,当行为主义革命之后,政治学研究学术性提高主要体现在广泛地使用数学模型,“大量政治科学学科的博士学位看起来就像经济学科的博士学位一样”⑩,但同时,这种门槛的提高却又面临着公众排斥的情绪,一个明显的例子就是21世纪初期美国政治学研究中所面临的“改革”呼声和美国国家科学基金一度要停止资助政治学研究等(11)。如果简单地认为实验方法拉大或缩小定量研究和定性研究的差距,或提高政治学研究的门槛,并不恰当,这既有当今政治学发展中方法论的融合、相互借鉴愈加紧密,也有实验方法相比早期传统的回归分析并没有体现出更深奥的方法论创新等缘由。
困惑4:信息超载的背景下,研究方法创新和研究理论创新孰轻孰重。信息通过“数据”进行表达,实验方法由于通过控制和比较来实现更多的信息收集,这种“数据化”过程会产生更多的数据要求,并形成自我累积循环。在研究方法创新过程中,有理论指导比没有理论而盲目地复制其他学科方法要更为可靠,没有理论指导的实验是空洞的,且貌似科学认知过程的实验结果也会被否定,当理论渗透到实验研究方法过程中的各个部分时,不但有助于扩大实验的外部效应和预测范围,还有助于改进实验流程和内部效应。所以,实验方法提供经验性贡献,而理论提供话语性贡献更具有基础性价值地位。
三、政治学实验方法的未来前景
实验方法应用中,由于研究者可以积极介入研究对象发展变化过程,在理论上能够辨识或剥离影响研究对象发展变化的特定因素,进而提供解读有关政治现象更为可靠的因果信息。但由于实验方法目前尚处于初步兴起阶段,其不仅仅存在上述诸多困惑,未来发展前景还主要受到如下因素能否得到有效解决的影响。
首先,实验室实验和田野实验的一致性验证(统计学意义上的因果意蕴和现实中的因果意蕴区别)。虽然将实验方法进行诸多分类,而基于实验开展地点的不同一般可以分为实验室实验和田野实验,其他区别还包括实验对象的背景环境、实验干预的类型以及结果的测量方法,二者为政治学的因果效应研究提供了互补的方法,都试图通过消除其他因素的系统性干扰,以使一个或更多的干预效应独立显现出来。田野实验倾向于评估真实世界的干预效果,而实验室研究注重创造一个受控制的环境,如会告诉参与实验的学生目前正在参与一项研究,他们的行为或决策正在被观察。同时,从研究开展的成本来看,实验室实验更低,更容易实现,而田野实验的代价更大更难;在时间维度上,实验室研究通常是在刺激干预后立即测量,田野研究则在几天后评估影响效果。
实验室实验和田野实验既有相同之处,也存在若干差异,显然,实验室实验由于其简单低成本优势受到更多的关注,但通常采用的实验室实验结果能否推广到田野实验之中呢?在现实研究中,围绕此问题如下名词往往成为讨论的中心——“介入性(Obtrusiveness)、干预真实性(Treatment
Fidelity)、结果测量和背景依赖(Context-dependent)的干预效应”(12)。这多是因为当前存在着实验室实验和田野实验相互矛盾的实验结果,如有学者对将实验室发现推广到田野的可能性持怀疑态度,认为典型的实验室实验改变了真实的决策环境(13),当然,也有学者给出实验室与田野两个领域一致性的证据(14)。围绕实验室和田野实验比较优势的争论,也就体现在实验室实验的外部效应演绎上,如果实验室实验不仅仅提供孤立的因果机制,也能较好地解释现实问题,即实验室实验和田野实验具有相互一致性的结果;此时,实验室实验所得到的结果不仅仅是统计学意义上的因果意蕴,而更具有现实中的因果意蕴,由于实验室实验开展的便利性和低成本,那么将极大有利于未来实验方法在政治学研究中的推广。
其次,实验取样中学生群体和非学生群体的影响。随着实验研究开展的增多,为了实验开展的便利,大多数的实验取样都依赖于大学学生。特别是在实验室实验中,学生是最常用的实验样本。学生作为样本在某些情况是合适的,如在实验中寻找内部有效性的因果关系(15),但在其他一些情况下,学生对于实验的反应和普通民众不一样。学生比较年轻、认知能力更强、配合权威和潜在的被动员能力更强,因此更容易被实验设计影响,如从实验中利用认知能力推断出“正确答案”。此时,这种以学生为主体的取样会影响到实验结果的可靠性和实验结果的外部有效性,特别是当实验结果要转移到非学生群体上的时候,这种差异更为明显。
将实验室结果向外界进行推演是政治学实验方法应用的重要目标,要实现这一目标,未来实验的实施者应该拓宽实验参与者的范围,如系统性纳入非学生群体作为实验室样本。比如,当我们想设计分析新媒体对公众政治行为和政治态度影响的实验时,如果参与实验者都是大学生,其无论是受教育程度、还是新媒体使用的普及程度都远远高于其他群体,如失业者、受教育程度较低者,这类弱势群体的特殊情况和需求往往没有予以足够的重视。当然,招募非学生人群参与实验存在诸多困难,比如缺乏对他们的物质激励、他们缺少对研究的兴趣、对校园环境不了解、对实验中专有学术术语难以理解等。对于这类问题的解决关系到未来实验方法在政治学研究中的效能提升和认可度提高。
最后,实验方法能否与其他研究方法有效地融合。在过去几十年中,政治学研究愈加强调不同方法的融合,这种融合既包括不同定量分析技术的融合,也包括定量研究方法和定性分析方法的融合。比如田野实验在复杂的现实环境中捕捉实验对象的行为,其所收集的数值数据、分类数据和有序数据等,同样可以在定性研究方法如民族志、人类学等采访、参与式观察和档案收集中获取,只有融合了以上两种类型的数据,才可以更好地发现因果效应,捕捉到政治行为背后所包含的背景信息。此时,定性数据可以增强、修改、甚至完全颠覆对定量数据的解释。
毫无疑问,当前政治学研究中实验方法的采用依然有限,这主要是部分政治学研究话题历史性太强,基于随机分配的实验干预,有悖伦理或者根本不可能。比如,革命和冲突爆发的原因、民主和平论的假设都属于这类范畴。而定性研究方法中案例选择策略、历史档案分析则能够为实验设计提供必要的辅助条件,当然,田野实验设计与传统定性观察研究的融合,还需要在战略案例选择方面(定性研究者在这方面尤为擅长)以及在某些情况下与政策制定者或者政治精英合作(16)。
事实上,实验法作为方法论发展中闪光点在于其与其他研究方法存在或隐或现的交叉和互补,如从互惠的角度看,形式化建模为实验研究法提供了用以验证、完善与探索的各种假说,而“恰当的定性研究方法运用也为实验的理论拓展和因果建构完善指明方向”(17)。未来,实验方法如果有效融合其他研究工具,不断提高自身解释力的同时,亦与其他研究方法沟通完善,这对于实验方法的未来发展推广至关重要。
结论
实验方法解决了部分传统定量分析的不足,但也面临诸多争论和困惑,其研究中的优势不应被过于高估。当研究人员受到过于盲目的鼓励,将关注点和研究资源转移到因果机制的实验设计研究上时,有必要首先回顾本文所提到的实验研究方法所面临的争议、所存在的困惑以及未来发展所需要解决的问题。
只有研究者能够清晰地看到一种研究方法在因果机制探索过程中的局限性所在,政治学研究中未来的方法创新才能够被进一步激活,否则,会误以为所做的研究探索已经简单地完成,这并不能有效改善政治学研究过程的科学性和严谨性,对于中国政治学发展而言,实验方法的应用尚未受到广泛的关注和应用,以中国期刊网数据检索为例,存在明显的反差:一方面,是有限的实验方法运用成果,另一方面则是显著的关注度和下载阅读量。同时,实验方法在经济学、心理学、社会学等学科中的应用要广泛地高于在政治学科中的使用。中国政治学研究对实验方法的采用,不仅要更为全面客观认知该方法的不足和优势,同样还应在具体的研究实践中反思性地使用,并不断加强政治学研究方法的规范性、严谨性和实践创新。
本文来源:《社会科学》(沪)2016年11期
本期编辑:吉先生