专栏名称: 政治学人

从这里开始自由的理解政治，自由的感悟政治。在这里为学术与公共生活搭建起平台。你的公民身份从这里再一次启程。

实证社会科学研究中的因果推断：挑战与精进

政治学人 · 公众号 · 政治 · 2024-09-17 09:58

正文

推荐语

实证社会科学研究面临哪些挑战？文章首先阐述了当前定量方法使用和质性研究中的常见问题，进而对定量和定性两种方法论的差别与联系进行详细说明，并提出了探索统一因果关系理论的必要性及其可能的实现路径。文章强调了理论导向的社会科学研究以因果推断为目标、多元方法为工具，有助于对既有的量化与质性研究进行反思，富有启发性。（政治学人编辑部）

专题文章推荐：

社会科学中的因果解释：逻辑、样本与方法的权衡

政治学研究中的因果关系：四种不同的理解视角

作者简介

王正绪，浙江大学公共管理学院教授；

栗潇远，同济大学政治与国际关系学院助理教授。

实证社会科学研究目前存在两个主要问题：过分强调量化方法的优越性；产生了大量低水平的质性研究。造成这些问题的原因是一些研究者对两类方法的方法论基础，以及两类方法对因果推断的不同效用仍缺乏足够的理解。量化研究对数据的质量和分析的方法有很高的要求，这是许多学者没有意识到的；现有量化研究在因果效应识别上存在诸多缺陷和挑战，需要加以改进，方向是清楚的。与量化研究相比，质性研究，尤其是比较案例研究和过程研究在确认因果关系和因果机制上具有突出的优势，但需要研究者依据研究目标进行科学的案例选择和研究设计。方法论和研究设计的前沿，是围绕因果推断的研究任务，探索统一因果关系理论及其可能的实现路径，例如多元主义方法论、融合两种实验法的逻辑路径，以及以嵌套分析为代表的技术路径等。

近年来，随着政治学、社会学、国际关系、公共（行政）管理等学科中的实证研究的发展，对方法论的讨论和研究也呈现出越来越丰富和深刻的局面。有关方法论的讨论，主要集中在定性与定量方法的优劣，以及新出现的方法如何使用等问题上。一些人倾向于强调量化方法的优越性，也容易将科学化的程度与研究的量化程度或量化方法的复杂程度等同起来。就常年以田野、调研、案例研究等方法为主进行学术研究的学者而言，在量化方法越来越复杂、越来越成为学术研究“科学化”程度的指标的情况下，以访谈、观察等为主要数据搜集手段的定性研究似乎有被边缘化的趋势。近年来，国内也积极引介了这种有关实证社会科学方法论的讨论和反思。

事实上，定量方法与定性方法对社会科学研究都是不能缺少的。对一些重要的研究问题而言，这两种方法都能形成非常出色的研究成果。同时，二者也都有非常清晰的缺陷，学术工作者对此应该有清楚的认识。在对方法论的讨论中，我们首先要认识到定量方法的缺陷与局限，破除对定量方法的迷信。其次，质性研究需要超越当前普遍存在的低水平的局面，向高水平的定性研究发展。在此基础上，我们应该认识到，将二者割裂开来、对立起来是无益的、错误的。方法论的发展，最重要是要形成统一的对因果关系的认识框架，而定性与定量方法或具体的某一种定性或某一种定量方法，均只是学术工作者从事因果理论探索的工具。

本文结构如下：我们首先概述当前实证研究在方法使用上的现状，集中阐述对定量方法的低水平使用和质性研究中常见的问题。然后，通过回顾现有方法论讨论中的经典的因果效应范式，分析其追求“原因的效应”的宗旨、假设和条件，我们将讨论指向定性研究在因果推断型研究中的特殊作用。之后，我们梳理质性研究方法领域的诸多理论基础，如机制发现、案例选择、过程追踪等，指出高水平的质性研究应该努力的方向。在此之后，我们围绕解释和推断因果关系提出评判实证研究科学化水平的统一因果关系理论和可能的实现路径，例如多元主义方法论、嵌套分析、实验逻辑等。我们还将以两个例子说明好的研究如何结合量化和定性研究方法的优势，进行因果推断的研究。最后是简短的几点结论。

一、定量方法的陷阱

20世纪后半叶，社会科学研究日益走上微观化和实证化的分析路径。以美国为代表的实证社会科学研究在方法特别是定量研究方法的使用上，取得了长足的进步。但是，在讨论研究方法时，我们首先应该明确，定量方法尽管带有“科学化”和“数学化”的光环，但在实际应用中却存在诸多巨大的陷阱。也就是说，使用定量研究方法很可能生产出表面看起来“科学”或“严格”但实际上却包含了严重的方法论错误的结果。因此，要正确地使用量化的研究方法，真正使量化方法服务于好的实证研究，首先要破除对量化方法的迷信，认识到量化方法的内在缺陷。

以政治学、社会学等学科为例，最常见的量化研究是通过问卷调查获得数据，然后进行描述性、相关性或多元回归的分析。这是“行为主义革命”以来发展起来的主要的量化研究方法，构成了当代社会科学研究的基本的量化方法体系。但是，这一量化研究模式存在着几个巨大的技术性陷阱，是一般学术工作者需要注意的。

第一，问卷调查对样本的代表性有着十分严格的规定。这种代表性的核心要求是全体中的任何个体在抽样之前被抽中的概率是相等的。为了达到这一目标，就需要实现抽样过程充分的随机性。然而很多研究者对这种量化研究所需的基础性前提缺乏方法论上的认识，要么利用熟人网络、互联网社交媒体等途径获取“方便样本”，要么一味追求更大的样本量。这些方式都是忽视了样本代表性的错误抽样方法。现有实践中，很多硕士论文、博士论文的研究中采用的问卷数据，都没有按照严格的抽样方法来获得样本。已经发表的论文中，抽样方法不符合随机性的标准也是非常常见的现象。

第二，大样本的数据集若要用于统计学分析，必须满足很多条件。每个样本观察值作为相关性和回归分析方法中最基本的分析单元，需要符合“同质性”这个标准很高的统计学假设。根据特定的研究目的，所有不同层次的观察单位，包括每个样本、各个变量、单个变量上的各个取值之间，都应当假定是彼此同质的。

第三，使用问卷调查对行为、态度进行测量，并由此进行因果关系的推论，具有很大的问题。一方面，截面数据难以展现确定的因果关系；另一方面，使用问卷调查来测量政治或社会观念、态度、行为，在问卷的问题设计和研究者试图测量的变量之间，很容易出现差距。此外，由于问卷调查和截面数据的先天缺陷，在使用问卷数据构建回归模型的时候，试图建立因变量和自变量之间的因果关系的空间是非常有限的。

事实上，现有诸多建立在非问卷数据上的量化研究，在概念的操作化、变量的测量、回归模型的稳健性等方面也都有很多值得商榷的地方。首先，概念的操作化需要满足一定的信效度标准，包括在长时间保持稳定，或要经得起不同测度标准下数据集检验的信度标准，以及在考虑测量指标是否真实抓住概念本质程度基础上的聚合与区分、内容与准则等不同的效度标准。其次，测量规则的设定总是面临来自事实和概念两方面的风险，包括过度主观性下对事实的简单化通约所造成的事实混乱和测量规则不能完全反映概念内涵所导致的形成概念偏移这两类错误。因此，测量规则能否尽可能地同时准确反映主观概念和客观事实，将成为检验一项操作规则优劣的关键。

这些量化研究中存在问题实际上可能源于理论、现实和方法三者之间的相互脱节。著名量化方法专家安德鲁·阿伯特指出，常见的通过线性回归进行定量分析的数据和模型需要满足几个重要条件，包括变量对属性的测量、单一的因果关系、因果关系不存在序列特征、各组因果关系直接相互独立、因果关系不受更高层级的因素（时空）影响等等。但是事实上，一般社会科学中多数的数据集和因此建立的因果模型都难以满足这些条件。为了解决简单的相关性分析和常见的线性模型在方法论上的严重缺陷，统计学家不断地发明一些更复杂的技术，比如分层线性模型、结构方程模型、倾向值匹配等。但这些方法对于多数学者来说往往不容易掌握，无法将其付诸应用。其结果就是，很多量化研究在样本的代表性、数据的质量、变量与概念的匹配、因果关系的假设和确认、因果效应的估算等环节都呈现出极大不足。

二、量化分析范式：估算因果效应

在认识论上，量化分析是建立在通过统计学模型来估算自变量对因变量的因果效应的范式上的。比如，如果有抽样调查的数据，就可以通过回归模型估算，在全社会范围内，平均每多上一年学会对就业人员工资收入产生多大的影响。这个估算“原因的效应”范式的重点在于测算某一因素（如教育）对某一结果（如收入水平）会产生多大的影响，而不是去发现某一结果（如收入水平的提高）是由或会因为什么因素造成的。实际上，影响收入的因素很多，有总体的经济发展水平、国家的经济政策、个人从事的行业、个人所处的区域、个人本身的素质如教育程度或领导能力等等。这些因素各自对收入的影响，是很难在同一个回归模型中进行估算的。

通过严格地选取样本、测量各个变量，然后建立严格的统计学模型——多数是回归模型，包括近年来根据严格的面板回归、双重差分等技术——来估算某自变量是否会对因变量产生显著的影响，可以说是量化研究的一条黄金标准。这是由美国三位著名的学者加里·金、罗伯特·基欧汉、悉尼·维巴在他们影响巨大的《社会科学中的研究设计》一书中对因果关系与因果推论所做的经典定义。必须指出，相对医学、心理学等领域而言，在通过统计学模型估算自变量对因变量产生效应这一方法上，政治学、社会学等学科已经是后来者。但是，KKV提出的这一研究设计范式，却在政治学研究方法论中获得了霸主般的地位，对政治学实证研究产生了统治性的影响。这一范式认为，因果关系首先表现为因果效应。因此进行因果推论最主要的工作是发现变量间的因果效应，即找出自变量（解释变量）不同取值时对应的因变量（被解释变量）的观察值中所产生的部分系统性差异。尽管KKV也承认某个相同的因果效应背后可能具有不同的具体影响机制，但他们仍然将识别“原因的效应”作为实现因果推断的方法。

长期坚持推动质性研究的学者，针对KKV对因果关系判断和因果推论的上述认知，从多个角度进行了批判。事实上，KKV所设定的因果效应范式错误地引导了社会科学中的推论逻辑。例如，就KKV因果推论逻辑下所强调的“最大化的观察值” ——即因果推论必须建立在大样本的观察值上进行——这一点而言，为了发现影响效应下的单位同质性和理解单位之间的异质性这两种说法可能存在一定程度上的矛盾，拉里·巴特尔斯认为要求样本最大化这种符合同质性假设的观察样本很难经得起推敲。现有许多研究以国家为单位进行大样本的回归分析，就是一个典型例子：将美国、中国这样的几亿、十几亿人口，社会经济结构非常复杂的国家与毛里求斯、马尔代夫、苏丹等人口、经济规模、社会经济结构差别巨大的国家当作“同质性”的观察单元来进行回归分析，问题是巨大的。另外，在比较政治或国际政治研究领域，以国家为单位的样本数量并非实验样本，很难像自然科学那样被人为增加，又或者从研究问题出发而根本不需要增加。

另外，在量化研究范式下，为了实现因果推断需要数据满足很多前提假设来尽可能降低估计偏差。即使是当前被普遍使用的面板数据，在进行因果推断时仍然存在很多风险。例如，在利用双重差分进行政策评估时需要考虑很多方面来避免常见的识别陷阱，包括（1）需要保证干预前趋势相对稳定且符合平行性假设；（2）干预组和对照组在结果上的差异不能过大，以保证可比性；（3）影响结果的具体干预时间需要被明确（考虑是否存在滞后效应），避免对干预时间点的错误归因；（4）除干预性政策外，还要考虑是否控制了其他同时影响结果的事件和变化。

再如，双重固定效应回归中的动态处理效应需要满足干预效应的同质性假设，即对所有被干预群体来说干预所起的效应是一样的。如果使用时间纵向数据进行因果推断，还需要符合严格的强外生性标准，包括：（1）不存在未观察到的随时间变化的混杂因素；（2）过去的结果不直接影响现在的结果；（3）过去的干预不直接影响现在的结果；特别是（4）过去的结果不直接影响过去以及现在的干预。尽管当前有很多数据处理办法用来检验上述假设是否成立，但在现实中这些准实验设计下的基本假设仍然很难保证能够同时成立，从而造成因果推断上的估计偏差。

三、比较案例研究：探寻因果关系的因素路径

认识到KKV范式的不足后，我们可以重新认识以案例为导向的研究范式，也即定性研究在确认因果关系时的重要作用。KKV式的量化研究可称为变量导向的研究，即通过在大样本的观察中寻找不同变量之间的相关性来确定自变量与因变量之间是否存在因果关系。一般称为定性研究的案例研究则是通过对不同的案例进行比较，或对案例内部的过程进行分析，来确立自变量与因变量之间的关系，以及自变量对因变量发生作用的机制。表1展示了这两类研究——变量导向和案例导向的研究——在案例选择、原因和结果等三个方面上的差异。

变量导向下的相关性研究旨在达到对总体进行随机抽样，以最大程度地排除人为因素干扰，实现最优的样本代表性。此外，这种研究更强调结果在样本观察值或自变量上的变化，试图寻找那些与结果变化最具相关性的解释变量作为原因。通过观察自变量取不同的值时因变量是否发生相同方向或相反方向的变化，来确认二者之间是否存在因果关系。同时，在量化研究范式中，不同的原因在解释上存在相互竞争关系——如果x1和x2两个变量都可能对现象y的发生起了作用，那么一般的回归模型往往很难甄别二者谁才是因变量也即现象y发生的真正原因，也不能确认二者是如何共同或分别对因变量产生影响的。而对于甄别不同的变量如何共同或分别对因变量产生影响，案例研究则具有突出的优势。

案例导向的比较案例研究则通过理论上的相关度来选择合适的案例。选择好案例后，要么进行案例间的比较，要么进行案例内的过程分析，以确定什么因素影响了因变量，以及该因素是如何影响了因变量的。同时，任何选定的案例，就研究者所关注的结果变量而言，是不需要发生明显的变化的。例如，通过比较英国和法国来研究“什么因素会带来工业革命”这一问题，这两个案例在“是否发生了工业革命”这一变量上的取值是固定的——即英国发生了工业革命，法国（最初）没有。通过比较一个发生了工业革命的案例和一个未发生工业革命的案例，可以找到两个案例之间的差异而试着确认带来工业革命的因素。此外，比较案例研究可以认定因果条件之间不存在竞争关系——不同的因素对因变量是否有作用是可以甄别出来的。

在此基础上，拉金提出了“作为构造的研究性案例”的思想，认为能够通过多元性研究来弥合社会科学研究中的大样本和小样本、一般性和复杂性之间的裂痕。这种潜在的研究类型强调对案例采取结构论式的理解——通过划定类型将案例的原始材料加工成更精练的属性空间来予以实现。

一般研究人员都理解经典的田野调查的方式，也容易通过这种方式构建细致、全面的案例研究。但是，质性研究并不等同于一般的案例研究或历史分析，它有着一套相当严密的科学逻辑作为质性推论的基石。在此基础上，质性研究通常把寻找因果机制作为研究的主要目标，并以此作为案例选择、案例比较和历史分析的出发点和落脚点。多数学者需要认识到，质性案例研究，也即一般常说的小样本案例或少案例研究，其功能强大之处在于两点：（1）通过结构化的比较案例研究，来确认客观世界里不同变量之间的因果关系。巴林顿·摩尔关于几个国家的政治现代化的研究和斯考切波通过中、法、俄的比较对社会革命发生原因的研究，都是这类典型。（2）通过案例内部的过程追踪，确认因果关系发生的机制。

所谓结构化的比较，比较政治学界一般会追溯到约翰·斯图亚特·密尔总结的用来寻找因果关系的五种归纳推理办法，包括“求同法”“求同求异共用法”“求异法”“共变法”和“剩余法”等。这种推理逻辑进一步被理解为质性研究设计中最重要的两项系统性设计思路，即最大相似性设计和最大差异性设计。其中，最大相似性设计的思维主要基于“为什么两个或多个很相似的案例，在某事件或过程中出现了完全不同的结果”这一问题，试图探究在控制了混杂变量和其他相关变量基础上的相似案例中的差异性x能否解释所关注的结果差异。例如，同样地处偏远、经济不发达且具有相似制度体系，为什么2000年起，贵州经济增长速度大大超过了广西？这就是一个最大相似性或求异法的设计。最大差异性设计的思路则基于“为什么两个或多个在各类指标或变量上完全不同的案例，在某事件或过程中出现了完全相同的结果”这一问题，试图寻找影响相同被解释结果y背后可能相同的解释变量x。例如，南亚的巴基斯坦、尼泊尔、孟加拉、斯里兰卡、马尔代夫等国，其国家大小、内陆还是沿海、与中国是否接壤、宗教、国内政治体制、党派关系等等都存在较大差异，但为什么都积极选择加入中国“一带一路”的倡议？

事实上，变量导向的KKV范式的大样本量化回归分析和案例导向的小样本结构性比较研究，都是基于一个同样的反事实因果逻辑的。因此，定量或定性看似不兼容，但在认识论和本体论上其实是一致的。无论构建的回归模型有多精致，或者基于结构性比较的质性案例选择有多复杂，都是通过反事实的比较，来确认带来某种结果的因素——小样本研究是在不同的案例间比较，大样本的量化研究是对不同类型或自变量取值不同的大量个体（观察）之间进行比较。但是，质性研究还有另一个重要的功能，就是确立因果关系在案例内的机制路径。

四、过程追踪：确认因果关系的机制路径

质性研究的另一种路径，而且是量化方法很难替代的路径，是通过案例内分析发现因素之间因果关系的发生机制。通过确认机制，研究者可以确信自变量与因变量之间的因果关系是真实的。简单而言，机制即是连接因果关系的原因与结果之间的链条。例如，下雨天会降低选举的投票率，也就是说天气与投票率之间存在因果关系。那么，下雨这个因素是原因，它与投票率下降这个后果或效应间应该有一个机制：下雨天增加了人们出门的困难，因而降低了人们出门投票的意愿。同样，如果两个大国同时拥有核武器会降低战争的概率，那么带来这对变量——拥核与战争——之间的因果关系的机制是，对手的核武器提高了本方感受到的战争会让自己国家灭亡的可能性，从而提高双方对战争的预期成本的计算，进而降低了发动战争的欲望。

可以说，对一个因果关系可以在两个层面来描述。以“原因A带来结果B”的方式描述，是在因素的层面来描述，即A是带来结果B的因素。以“原因A触发了机制M，从而出现了结果B”，则是在机制层面的描述。我们也可以说，因素层面的描述，叙述的是“为什么”的因果关系——因为A，所以B。相较而言，机制层面的描述则叙述了“怎么样”的问题——A如何带来了B。这样，机制（M）与原因和结果的关系，就可以写成I-M-O的公式，即把机制看作是是联结输入/原因和输出/结果之间明确、可观察的关系。更严格地讲，机制是一组能被持续观察或通过推理获得的固定互动规律的因果关系。

过程追踪即是确定因果机制、分析“怎么样”的研究方法。通过综合分析各种证据，确定某个因变量是否因为某个自变量的影响发生了变化。例如，同样是要验证天气影响了投票行为这一因果假设，我们可以通过追踪一个单独案例（某个具体的投票人）在下雨的当天，的确因为天气原因放弃了出门投票的想法的过程。这即通过找到和确认各种证据追踪了自变量（天气）对因变量（投票）产生了影响的过程，因而确认了天气对投票行为发生影响的机制，并且确认了天气与投票行为之间的因果关系。过程追踪的一个重要作用是通过分析各种证据来排查竞争性的假设。例如，通过过程追踪，我们可以确认，某人在投票当天未去投票的原因，的确是来自天气的影响，而不是其他因素（比如她当天正好有客人来访）；同样，对于空难之类的结果究竟是什么因素造成的，存在很多可能性，而通过过程追踪则可以排除一些因素，确认准确的原因。

过程追踪要求确立从原因到后果之间不间断的因果路径链条。例如，如果研究者的理论假设是一国存在石油资源会损害国家的治理质量，比如会催生政府腐败，那么过程追踪就需要展示石油是如何一步一步带来政府腐败的。这种对完整因果链条的要求对数据的可获得性和理论的决定性有着很高的要求。另一方面，在能够获得的证据中可能存在不止一个因果机制上的假说。也就是说，对于某个证据或事实，你如何证明它支持你的理论假说而不是支持另外一个理论假说。这方面，质性研究的方法论已经形成了一系列判断证据对理论假设的支持力的标准，根据贝叶斯的逻辑，来判断具体证据对理论假说的支持力。

总之，好的质性研究同样在追求一种根据特定的初始条件来预测结果的理论。不同于因果效应的关键点在于，这一追求需要展现因果解释链的效力，以便识别、检验和发展理论，同时揭示这种因果机制在所预测的案例中是真实运作的。只有做好这点，研究者才能实现对质性研究内在缺陷的规避和超越。

五、统一的因果关系理论

上述分析表明，我们需要从更广泛的视野出发来重新审视社会科学的根本任务和实证研究所运用的不同分析路径，尝试在多元主义方法论的认识论前提下探究实现统一因果关系理论的方法论路径。充分理解不同研究方法的特点和长处，是达成多元主义方法论共识的必要前提。研究者应当保持对待不同的研究方法的开放性态度，即便是自己不使用的研究方法，也应该了解它们的原理以及它们对自己所关注的研究问题会有何裨益。这样，我们就能比较全面地理解定性方法与定量方法的相通与差异之处，学术界也就可以避免因为研究方法的不同而带来的很多分歧。这是当前学术界对研究方法和研究设计的探讨应该形成的共识，也是学术研究实践的总体要求。最重要的是，为了摆脱不必要的方法论争论和更好地发挥多种研究工具的相对优势，我们需要探索迈向统一因果关系理论的潜在方法论路径。

首先，不同方法论层次上的差异可以在社会科学的本体论维度中取得共识。唐世平认为，迄今为止社会科学领域的诸多认识论流派和纷繁方法技艺都是为了更好地完成对观念、行动和结果这三大实体的解释而存在的，同时它们的效用也都受到本体属性的约束和限制。通过构建本体论上的“观念—行动—结果”的广义理论框架，研究者只要充分了解这些认知类型和分析工具在解释三类根本客体上的优势和劣势，就能够在工具层面进行综合或折中式的选用，也就不需要拘泥于某种单一范式或技术手段。

尽管可能还有些争议，但学术界大体认可好的实证研究应该以因果推断为目标，即通过实证研究发现、验证因果规律。对研究类型的分类以及以因果推断为目的的研究与其他类型的研究的比较，已经有不少著述论及。验证机制的目的正是为了获得对事物运作的满意解释，最终实现人们在心理层面对事实更加深入的理解。在这样一个机制、解释和理解之间相互统一和贯通的社会科学研究的整体图景里，各种研究方法虽然各有优势和劣势，但是只要使用合理，都可以成为因果推断的有益工具。研究者不论擅长使用哪一种方法，都要既发挥该方法的长处，又避免使用该方法时出现错误。

其次，不同方法论背后看似对立的逻辑差异也存在共性。量化和质性研究方法之间除了样本大小的差异外，区别可能仅仅在于量化方法采用的是概率性和连续性的推理（某自变量如果对因变量有足够大的统计效应，则有很高的概率二者之间的关系是真实的而不是纯偶然的），而比较案例研究采用的布尔代数逻辑和类别性推理。陈超与李响将这个区别表述为“逻辑因果”与“量化相关”的差别。连续相关性表现为自变量对因变量的连续性的（0到无穷大）回归效应上，而类别性的因果关系体现为自变量是或不是（1或0）因变量的充分条件或必要条件。这两种逻辑的差异其实是可以弥合的。例如，就吸烟和肺癌之间的关系而言，在量化的逻辑下，用大样本的数据建立的回归模型会发现吸烟（自变量）对肺癌（因变量）有一个具有统计显著意义的效应。用因果逻辑表述，吸烟既不是肺癌的充分条件，也不是它的必要条件——吸烟一定要和其他一些因素结合在一起，才能影响肺癌的发生。但是，吸烟正是得肺癌的一个“非必要但充分条件”的“不充分但必要”的一部分——吸烟和某些因素组合，在某些情况下会致癌。这样，小样本研究中的著名的INUS（insufficient but necessary part of a unnecessary but sufficient condition）的因素，在大样本的量化模型中就体现为自变量对因变量的一个显著的回归效应。如此，量化模式与比较案例模式的因果推断方法就统一起来了。

简而言之，各种方法的差异只是操作性的。定量方法是通过大样本或实验或准实验的方法，依据统计学的概率理论，寻找不同变量之间的相关性。用KKV的说法，实际上是通过计算某自变量的单位变化是否会对某因变量产生显著的效应。这一类研究，即便通过严格的方法——如样本控制、实验程序的控制、计量模型的优化等——确认了两个变量之间的确有这种相关性，并力求通过严格的设计或模型，确认该自变量是该因变量发生变化的原因。这样的方法与质性研究中按最大相似性或最大差异性设计的结构化的小样本比例案例研究，遵循的都是密尔式的反事实逻辑。

最后，从实操性技术上如何在统一的因果关系分析框架下实现因果推论，不同学者给出了各有侧重的解决方案。其中最简单的办法是综合运用不同方法尽最大可能回答“为什么”和“怎么样”的问题。无论是KKV式的通过大样本的量化模型估算自变量对因变量的效应（effects of causes），还是密尔式的结构化比较甄别差异的原因（causes of effects），就因果关系的识别而言，两者均只是回到了“为什么”的问题——即某个后果是由哪个原因造成的。但是，在回到了“为什么”的问题之后，如果不能回答“怎么样”的问题，即不知道该自变量“为何”会带来了该因变量的变化，我们的知识仍然是不完整的。举例来说，即便通过实验方式，我们知道了某种药物对某种疾病有疗效（以及这种疗效的程度），但是，除了知道这种药物是带来这种疗效的原因，我们还需要知道，该药物是如何（怎么样）对该疾病产生疗效的。而要回答“怎么样”的问题，在药物这一例子中，我们就需要去研究药物的成分如何对造成身体内疾病的病毒、细菌等成分造成了影响——也就是要进入事件（药物治好了病）内部进行研究。对社会科学的研究而言，对少数案例进行案例内部的分析，才可以搞清楚从自变量到因变量之间的机制链条。再如，由于对先验知识的忽视和缺乏基本机制的指导，假说在随机对照实验中的外推有效性普遍较差。因此，研究者往往需要与其他方法相结合，不能止步于发现“什么行之有效”，还要将探究“为什么行之有效”作为目标。例如，如果我们通过大样本研究，发现使用某一本新的教材的同学的学习效果好于使用其他教材的同学，这就能识别出“学习效果提高了”这一结果的原因。这一项研究回答了“为什么”这些同学学习效果好于别的同学的问题，也回答了“哪一本教科书有效”的问题。但是，我们还需要去研究该教材如何提高了学习的效果，回答该教材“怎么样”提高了学习效果或者它“为什么有效”的问题。这就可以通过分析该教材的内容，观察、跟踪个别学生在使用该教材过程中的学习体验等工作来实现。

最近一些新的方法或研究设计，有助于研究者在统一的因果关系分析框架下最大限度地实现因果推论。一般的实验性研究都是基于总体的量化相关的研究，而随着计算机模拟技术在社会科学中的运用，可以对于单案例进行反事实模拟实验，从而有助于识别关键变量和取值范围，并直接有助于检验理论和强化因果论证。唐世平称之为一种属于因果过程或因果机制导向逻辑下的“新机制哲学”。同样沿着类似路径的是埃文斯·利伯曼所提出的一种嵌套分析的混合分析的技术手段。这一技术策略试图去整合小样本分析和大样本量化分析这两种方法。研究者需要先通过大样本分析的方式形成最初的结果和模型，然后采用小样本分析的办法进行模型检验或模型重新构建。其中，SNA（小样本）和LNA（大样本）在案例选择上的区别是前者是按照回归结果有意识地选择，后者是在回归线上任意选择。在模型构建过程中，倘若小样本分析同模型建构不一致，则考虑对此进行检验，即使检验不通过的话也不深究可能的潜在新理论。还可以通过研究设计来构建逻辑自洽的因果理论系统，选择不同的方法共同服务于研究者的理论分析框架。格林提出，在研究设计中使用“提升事件发生可能性的原因”来界定因果关系中最核心的部分或作为最小定义，并设立了应当遵循的一系列逻辑标准来构建一个统一而非多元的因果关系分析框架。唐世平则提出“因素+机制”的研究设计来构建整体性的因果推论——即围绕理论框架和研究假设，采用不同类别的研究方法构建或检验理论。下文将举例说明。

六、研究释例

大样本的量化相关分析与小样本的案例内分析结合起来的嵌套分析，能够有效地实现对因果关系中“因素+机制”的识别。这是充分利用量化和质性研究各自的优势来构建因果理论的比较简单易行的操作。这类研究近年来发展较快。菲利普·罗斯勒对非洲内战—政变陷阱的分析即是一例。非洲国家中，为什么一些国家能实现基本的和平，而另一些国家深陷内战和族群冲突的困境？作者在深度案例研究的过程中，发现非洲国家的统治精英面对一个内战—政变的陷阱：为了避免不掌权的族群为争夺国家权力发动内战，就要将国家权力分享一部分给那些族群的精英。但是，这种权力分享的安排，又容易使获得权力的族群精英为了争夺国家权力而发动政变。

在通过单案例（即小样本）的方法形成自己的理论假设后，罗斯勒进一步使用大样本的量化方法对该理论假设进行检验。他通过对族群权力关系数据集建模分析发现，分享权力的情况下政变发生的次数更多，且更易取得成功。当掌权的一方排斥同谋者的时候，政变或叛乱（内战）发生的概率会增加，而且，同谋者从同谋到被排斥的时间越短，发生政变或叛乱的可能性更大。在用大样本的量化模型检验了假设之后，作者进一步用小样本分析，追踪了1998年发生在刚果国内冲突的过程，展示了权力共享安排被打破后，该国的主要政治方如何一步步地将国家带入了后来被称为“非洲大战”的内战中。作者进一步对中东地区的伊拉克和叙利亚案例中的内战和政变关系进行过程追踪，展示权力分享与排除对内战或政变后果的影响。而乍得（1980—1990）和利比里亚（1980—1990）这两个共谋者间战争的案例，则展示了政权内部共谋者之间的承诺问题是如何通过带来政治不确定性和内部安全困境，最终招致了大规模的暴力。这种案例内分析的办法得以充分展示实证假说中机制的发生条件和对内战爆发的真实影响效应。

唐世平等人对全球各国的石油资源与族群升级的一组文章，是量化方法（识别因素）和小样本案例内的过程追踪（识别机制）结合的好例子。这批文章分别以定量、定性方法以及更为细腻的负面案例的过程追踪来检验他们对石油资源与一国国内族群冲突提出的因果理论。作者挑战传统解释族群冲突爆发或升级的理论假说，认为族群冲突的爆发或升级并不在于弱国家能力、资源的出现和生产，而在于资源发现时所处的地理区位是否刚好落在少数族群的核心领地。作者选择三个传统意义上的正面案例——南北苏丹、尼日利亚的尼日尔河三角洲和伊拉克库尔德地区，加蓬作为油田不存在假说中所需的区位条件下的负面案例，从正反两类案例对比中初步提出了用于解释族群冲突爆发或升级的“因素+机制”的理论。

为了进一步验证这一理论背后的推广性，作者使用了基于GIS下的地理—族群权力关系数据集进行建模分析。该数据集涵盖了1946—2010年125个国家层面以及1946—2005年相应族群层面，形成了对族群特征及其分布地理位置的面板数据。同时，他们还借助美国地理调查数据库来测量油田的地理区位，从而整合了族群的地理位置和油田的地理区位来作为关键的两个解释变量。最后，对于这一族群冲突的广义理论的假说到底是通过何种机制实现或者如何被抑制的，作者又详细分析了印度尼西亚的亚奇叛乱、南苏丹分离运动等正面案例来进行“冒烟手枪型”测试。这些案例研究甄别了石油与族群冲突的机制：少数族群聚居的核心领地发现石油后会激起由多数族群掌握的中央政府控制石油的行为，从而点燃历史上的族群怨恨，造成相应冲突的不可避免。

作者还重点补充了两个重要的负面案例——两次车臣战争和纳戈尔诺-卡拉巴赫冲突，清晰反驳了定量分析中可能存在的虚假相关。同时，作者借助质性研究中的反事实视角，推导出更加一般的理论假说：当任意矿产性资源在发现后不足以为某个群体轻易霸占，这种资源的发现就能保证族群和平的实现。反之，当资源发现的区位在少数族群的非核心领地，或者落在多数族群的所属领地当中，就会通过激化族群积怨的机制造成冲突的爆发或升级。可以看到，这些特定质性案例的选取和分析有效地弥补了传统典型案例分析和定量回归模型在验证理论假说方面的不足，并令假说更好地展现出细腻且真实的机制在时空上的发生条件。

如此，该系列文章基于严格的理论假设，按照定量与定性方法互补而非相互竞争的思路，彰显了不同研究方法在相关联因素间的稳健性检验和确立特定因果机制、探讨情境如何对机制运作产生影响上的分析优势。这一组工作表明，综合运用不同研究方法，有助于研究者对事实做出最恰当的解释和最深入的理解。

七、超越方法，走向因果

本文从实证研究方法论的现状开始讨论。一方面，我们强调学术界要避免以量化方法为优先或“高级”的迷信。事实上，定量方法有其先天的不足，而定性方法在因果推论上也有独特的优势。另一方面，我们强调，无论是量化方法还是定性方法，研究者都要避免低水平的使用。定量研究的学者往往忽视定量方法背后的统计学和概率论的基本要求，而现有的定性研究的学者往往离结构化因果因素识别和因果机制的确认距离尚远。对量化方法的错误或不严谨使用，往往会形成表面看起来很“科学”，但实际内容却存在严重谬误的作品。而对质性方法的低水平使用，则形成大量低水平的作品的堆积，不能有效地推进理论建设和增加我们认识客观世界的能力。

随后，本文试图对定量和定性两种方法论的差别与联系进行仔细说明，特别是对质性研究在因果关系研究中的独特的优势做了说明。通过结构性比较和案例内分析，可以从因素和机制两个层次来识别和确认因果关系。而以因果关系为核心的实证研究，其知识成果即是社会科学中的实证理论或中层理论，是理论导向的社会科学研究的主要目标。无论量化还是定性方法，都有技术或者方法论本身作为工具性的存在，需要成为连接理论假说和经验事实的中介，从而确保技术、理论和经验三者共同为研究问题服务。因此，基于研究问题的实际需要，一方面，研究者需要准确和严格地掌握研究方法，避免错误地和粗浅地使用研究方法；另一方面，研究者要掌握灵活运用不同研究方法的能力，超越定量与定性之争，分别发挥定量和定性各自在因果推断与因果机制上的优势。

确立因果理论认识论基础上的多元方法论，不仅能够避免出现某种方法形成话语霸权的局面，也可以消除定量与定性研究之间孰优孰劣的争论，促进使用不同研究方法的学者之间的对话与融合，避免因为研究方法的差异而形成鸿沟。事实上，我们要鼓励和容纳不同类型的研究——例如经验描述、理论创制、假说检验、政策分析、媒体评论性文章等不同类型的学术和科研活动。同时，我们又要认识到，不论是进行哪一类研究活动，我们都需要掌握多元的方法组合。在此基础上，我们才能在理论论述与社会机制相联系基础上探索出一套有中国特色的社会科学本体论范式，形成中国特色的社会科学话语、概念、理论体系。

责任编辑：牛铮

一审：胡皓玥二审：卢腾终审：肖伟林

文章来源：《社会科学》2023年第8期