若转发本公众号文章,谨请标明“混合研究”
本文以《社会学研究》所发表的社会研究方法论文为线索,从方法论、定量研究方法、定性研究方法、社会调查方法等几个大的方面,系统回顾和评述了三十年来《社会学研究》所发表的研究方法论文中最为重要的研究主题及其相关研究成果,并对介绍和评价新研究方法的论文进行了综述。本文认为,《社会学研究》及其所发表的社会研究方法的论文在推动和引领国内社会研究方法领域的不断进步、促进国内社会研究水平的迅速提高上,做出了积极的、不可或缺的贡献。同时,文章也对《社会学研究》杂志提出了两点期望。
关键词:社会研究方法 方法论 社会调查 定量研究 定性研究
方法论( methodology) 既涉及社会研究的哲学与逻辑基础,也涉及社会研究的规则和程序体系。三十年来,《社会学研究》不仅发表了一批从哲学与逻辑基础层面对社会研究方法论进行探讨的论文,也发表了一些从规则和程序体系层面进行探讨的研究论文。
首先,围绕着实证主义方法论与反实证主义方法论,学者们进行了积极的探讨。
其次,最近十年中对方法论的探讨相对集中地体现在对社会研究中的因果关系或因果分析及其证明上。
第三,近十几年来方法论探讨的另一个明显特征是开始对定性研究方法论予以一定的关注。特别是西方社会学中流行的女性主义方法论也因其独特的视角和命题模式成为近些年来国内方法论研究中的另一个热点。
从社会学恢复重建以来,随着对国外社会学研究方法的介绍和向西方社会学研究学习过程的进展,定量研究方法( quantitative researchmethods) 越来越多地受到国内社会学界的关注,定量研究也逐渐成为国内社会学研究的主流特征。国内学者也不断围绕与定量研究方法相关的议题进行了探索,其中最主要的研究集中在概念操作化、测量、研究设计、显著性水平等问题上。概念的操作化及其测量是定量研究的瓶颈。《社会学研究》发表的方法论文中,有多篇论文都关注了这一重要主题。其中既有从理论角度对操作化概念进行的分析,也有从应用角度对概念化方法、测量指标等等进行的探讨。
张小天在《论操作化》一文中,针对现有操作化理论的不足,专门对操作化的概念和有效度进行了分析。作者首先从概念上将操作化区分为“形成指标、指数或量表的过程”以及“形成测量的方法及步骤的过程”两种。然后集中讨论了第一种意义上的操作化问题。作者在对“概念”和“变量”进行区分后,从概念测量能否实现以及这种测量的可靠性问题出发,对于为什么要进行概念的操作化提出自己的看法,并在理论上指出了进行操作化和表面有效度评估的一些原则。他指出,研究者在测量变量时,这种测量能否获得以及测量的可靠性如何,会因为若干因素的不同而不同,这些因素包括: 被测变量的性质、被测对象的特点、测量所利用的途径、所使用的方法、所选择的被调查者、被调查者是否了解被测变量的含义或研究者提问的含义、测量所处的环境以及被调查者是否愿意真实回答研究者的询问等。由于这种原因,讨论社会研究中的测量问题时,可以将变量分为两群,一群是社会研究者无法可靠地测出的变量,另一群是可以可靠地测出的变量。操作化就是为属于前一变量群的某个变量在后一变量群中找到对应的变量( 即指标) ,以便能够用操作测量方法可靠地测量这个变量( 张小天, 1994) 。
沈崇麟关注定量研究中最为普遍的测量误差问题。他首先举例说明并区分了社会统计学中误差的两大类型,并在此基础上集中探讨了测量误差,即“由概念构成的维度向操作化的变量转变过程中所产生的”上述两类偏差。他指出,概念的定义误差、概念的度量层次误差以及概念的测量指标误差是发生在研究设计阶段的测量误差,因而可以叫做“设计者误差”。控制这类误差的关键在于提高研究人员的素质。另一方面,在社会研究的执行阶段也会发生各种测量误差。最主要的有被调查者未能按照调查的要求回答问题所形成的回答误差( 包括有意的回答误差和无意的回答误差) ,资料收集后进行信息处理的误差( 主要包括编码误差、过录误差、输入误差) 以及抽样误差、随机误差、常量误差、相关误差等( 沈崇麟,1990) 。这种对定量研究中各种类型测量误差的详细分析,对于帮助研究人员提高研究质量、避免和减少这些误差的产生有很好作用。
在概念操作化及其测量的应用方面,《社会学研究》所发表的论文还有一个突出的特点,就是许多学者结合实际研究的例子,对特定研究领域中的核心概念及其测量进行了专门的分析探讨。
比如,在婚姻与家庭社会学领域,夫妻权力和妇女家庭地位都是重要的研究主题,而对这两个主题中所涉及的核心概念的测量则是在研究方法方面十分重要的探讨内容。徐安琪在对以往中外研究文献中关于夫妻权力测量的五种模式逐一梳理的基础上,使用第二期上海妇女社会地位调查数据资料,对家庭权力的测量及其与妇女家庭地位的关系等问题进行了学术反思和检讨。她认为,多维指标测量家庭权力缺乏效度和可操作性。不同指标受性别分工和权重的制约,同时,多项指标缺失值高也使得整合复合变量的难度增加。另一方面,相对权力指标在微观研究中存在一些缺陷或困扰,比如丈夫权力越少是否妻子地位就越高,权力和义务是对应一致还是对立相悖等。对此,作者建议妇女家庭地位的测量应关注两个侧面: 一是个人在家庭生活各方面的自主权,二是婚姻角色平等的主观满意度。对于后续研究,作者也建议采用质化和量化研究相结合的方法,对显性和隐性的家庭权力的形成及其运作过程进行多维、动态、细致的观察、发现和由表及里的分析,以丰富和深化妇女家庭地位测量和解释的研究成果( 徐安琪, 2005)
人际关系则是社会学、社会心理学研究中十分重要的主题之一。人际关系研究中十分关键的一环是对人际关系的测量。李宁宁结合我国的国情,采用实验的方法,对人际关系的两种测量方法进行了比较研究。作者的研究结果表明,虽然参照测量法素以揭示群体中心人物见长,但其实验结果却表明,它受权力因素的影响较大,不适于在独立性差、人们有着较多交往、感情维系较为重要的团体中采用; 而社会测量法不仅在群体结构的分析方面可以大显身手,在群体中心人物的揭示方面也并不乏力。“因此,对于人际关系的测量方法的评价不是简单的,其使用的准确性受所测对象性质的影响”,我们不能简单地、武断地宣称两种测量方法谁优谁劣,而只能结合具体情况,说明在哪些情境之下,哪种方法更为恰当。即“必须在了解对象的基础上有选择地使用”( 李宁宁, 1987) 。
在定量研究方法逐渐成为主流的同时,学界对定性研究方法( qualitative research methods) 的研究也始终在持续。学者们同样在对西方的学习和中国的实践中不断发掘着各种定性研究方法的作用,也不断进行着定性研究方法的探讨。
个案研究是定性研究方法中最为常用的方式之一,也是在定量方法成为主流的社会学界备受责难的方式之一。个案研究方法遭受最多批评的问题是它的代表性。或者说是仅仅研究一个个案究竟有多大意义的问题。王宁在《代表性还是典型性》一文中着重讨论了个案研究方法的代表性问题。作者认为,个案研究的代表性问题是一个“虚假问题”,“因为个案研究并不一定要求个案具有代表性”。他首先通过对代表性的含义进行界定,指出代表性是样本的一种属性; 然后指出任何样本的出现都有一个前提,“即总体的范围和边界是清楚的”。而由于个案研究中并没有范围和边界明确的总体,“所以个案不是统计样本”,因而“它并不一定需要具有代表性”。在否定个案的代表性的同时,作者又通过区分两种不同的“扩大化推理”逻辑,说明个案研究采取的是一种与统计性推理不同的“分析性推理”,来达到认识某一类现象的目的。而要使个案研究的结论能够外推的关键,则是保证所研究的个案具有典型性( 王宁,2002) 。
同样是关注个案研究方式,王富伟在《个案研究的意义和限度》一文中,从“个案研究的结果同样是一项知识”的命题出发,系统分析了费孝通先生的“类型比较法”、格尔茨的“深描说”和布洛维的“扩展个案法”。并从“整体—部分”的维度以及“经验—理论”的维度,对三者处理个案超越问题的内在逻辑及其利弊得失进行了比较。作者认为,这三种取向的个案研究都有着超越个案的诉求,但三者超越的方向却有所不同。虽然三者都在理论层面上实现了个案的超越,“但却在事实层面上有着未能克服的问题”。而造成这一问题的根本原因在于对现实世界所持有的实体论的假定。作者认为,如果我们“不想放弃对整体认知的追求,那么就需要对现实采取一种非实体论的看法,即‘关系的’( relational) 本体论”。正是从这一前提出发,作者提出“我们所进行的应是关系个案研究,所追求的应是关系性整体”。而“以此界定个案研究在事实层面上的超越,是一种有限,即只追求更大范围内与个案相关的事实”。在论文的最后,作者再次回到个案研究的知识命题,提出个案超越所带来的知识增长既可能是“突发式”的,也可能是“累积式”的,但都需要得到学术共同体的认同( 王富伟, 2012) 。
深度访谈是定性研究中最为常见、也最为有效的研究方法。杨善华等人从意义关联的角度对于这一方法进行了详细的分析和探讨。作者在简要概述深度访谈两个主要特征的基础上,将讨论的中心聚焦在“深入事实的内部”这一本质特征上。并从意义的角度分析了与访谈有关的各种意义体系。作者结合自身实践的经验,提出了一些与深度访谈有关的操作原则,比如悬置的态度、了解被访者的日常生活、以被访者的生活史为最佳切入点、全方位的观察、辨别“意义”和“事实”、三层次的文本分析等。通过分析,作者认为,深度访谈涉及到研究者和被访者之间面对面的我群关系。“在这种关系中,研究者需要悬置自己的知识体系和立场”,既要通过访谈“进入到被访者的日常生活中去”,又要“随时保持反思性的观察”。访谈的过程应以被访者的日常生活及生活史的结构为结构,以发现问题、追究问题,最后再讨论个案的普遍性意义( 杨善华、孙飞宇, 2005) 。
焦点小组讨论( focus group discussion,也译为典型组讨论等) 是社会学、人类学、传播学、政治学等社会科学中常用的资料收集方法之一。这种方式可以为研究者了解研究对象的思想和情感提供十分独特的方式。李冬莉详细介绍了焦点小组讨论方法的基本思路和具体操作方法,以及作者亲身参与的两个具体的研究实例。在此基础上,作者分析了焦点小组讨论方法的主要优点及其局限性。作者认为,相对于参与观察法,焦点小组讨论的优点是可以在较短时间和大得多的范围中获得丰富的定性资料; 热烈的讨论气氛可以激发出单独访谈难以问出的意见; 对误报和瞒报有一定抑制作用; 相对节省费用,等等。但由于讨论组成员少,资料不能用来做定量分析; 资料质量在很大程度上取决于主持人的水平与技巧; 调查对象可能附和他人而不谈自己的真实想法;资料收集过程和结果的分析都很难避免研究者的主观性。这些都是焦点小组讨论方法的局限性表现( 李冬莉, 1998) 。
随着问卷调查方法的广泛运用,学者们也开始对问卷方法的方法论背景、意义界定以及在中国社会中运用所遇到的问题展开了研究。
卢汉龙从加芬克尔的著名实验开始,对社会调查中问卷的意义界定问题进行了探讨。他指出,加芬克尔的实验揭示出一个重要问题,即人们对世界上同一事物的认识将随着他对事物表象的各种不同意义的解释而产生不同的结果。在社会调查中,调查问卷实际上是连接和沟通调查者与被调查者的纽带,在整个调查过程中,调查者和被调查者都会对问卷中的问题和答案形成自己的一种意义解释体系。因此,研究者在设计问卷时,必须同时了解被调查者接受调查时所使用的意义界定体系。研究者要使自己的意义界定体系与被调查者的意义界定体系尽量取得一致。而如果研究者所设计的调查问卷在调查者与被调查者之间没有吻合度较高的意义结构,研究结果的有效度和可信度是值得怀疑的( 卢汉龙, 1987) 。
李强则根据自己的研究实践指出,在中国做问卷调查的最大难题就是频频遇到人们相互冲突的“心理二重区域”现象,即日常生活中所说的“说假话”的问题。作者指出,在人们的心理上存在着两个不同的区域,一个是可以对外公开的区域,另一个是不对外公开、属于自我保密的区域。而中国人的心理二重区域现象显得更为突出。在调查中,这种心理二重区域现象往往会有各种不同表现,如掩盖事实欺骗对方、两套话语体系、内外有别、失去自我、集体本位以及两套记录体系等。作者认为,造成这种心理二重区域现象的原因是中国人的家庭关系以及儿童的成长环境。而要在调查中避免这种现象给调查带来的偏差和影响,作者也从确定研究领域、设计研究问题、实地调查记录、数据分析和解释等方面提出了应该注意的问题( 李强, 2000) 。
社会调查中,面对被调查者进行当面访问的访问员不仅承担着非常重要的收集问卷资料的角色,同时也承担着保证整个调查质量的重要角色。访问员在调查过程中对被调查者的诱导性提问、催促回答以及臆答( 即在访问过程中,访问员对问卷中的某些题目并不提问受访者而自行填答的做法) 等现象,是影响调查质量的重要原因之一,在纸笔方式的面访中研究者也很难监测。严洁等人将研究的焦点集中在访问员臆答现象上。作者通过对北京大学2010 年“中国家庭动态跟踪调查”的数据分析发现,农村成人问卷中有接近10% 的访员臆答现象发生。研究者采用事后准实验设计的方法,探讨了访员臆答的发生与访员特征的关系、访员臆答如何被监测、访员臆答现象如何进行干预以及干预的效果如何等问题。研究发现, 52%的访员都存在臆答现象; 各类问卷中,有臆答现象的问卷比例平均为18. 8%。从年龄来看,18 - 24岁的访员的臆答问卷比例最高; 按职业分析,计生干部、村居委会干部、无业待业人员以及政府企事业单位职员比学生访员更容易发生臆答。对臆答现象进行干预的结果发现,首次干预可以显著降低臆答问卷比例,特别是对年轻访员的干预效果最好,干预后臆答比例下降最快、最大。其研究结果对于社会调查从纸笔面访向计算机辅助面访( CAPI)过程中提高质量监控效果具有较好的参考价值( 严洁等, 2012) 。
而跟踪调查作为调查研究方式中最具因果推断价值和动态研究价值的方式,深受社会研究者青睐。研究者通过追踪调查对象个体成长历程中的社会、经济、文化、教育、健康等指标,将个体的发展与社会的变迁直接关联起来,研究社会环境变化与个人发展之间的关系。但与此同时,跟踪调查中调查对象的流失、追踪的困难以及由此所导致的样本估计准确性下降、样本代表性下降等等,也是令社会研究者最为头疼的问题。
孙妍等人运用“中国家庭动态跟踪调查”的初访数据和追访数据,分析受访对象社会经济特征与拒访行为之间的关系,进而为追踪研究中有效地进行样本维护和提高追踪调查数据的质量提供依据。其研究结果表明,在初访调查中已经接受访问的受访家庭中,在对其进行追访时的样本损失存在选择性问题,具体表现为拒访家庭与参访家庭在家庭结构、规模等社会经济特征变量上的显著差异。而被拒访的特点及模式与发达国家跟踪项目基本一致,即受到受访家庭主事者社会经济特征、参访经历等因素的影响。作者同时指出,由于他们所采用的数据的限制,其研究中并没有控制访员的个人特征,例如年龄、性别、经验、行为模式等因素,而所有这些因素都可能对受访对象的拒访发生比产生直接影响( 孙妍等, 2011) 。
梁玉成则以“中国健康与营养调查”( CHNS) 为例子,探讨了在中国进行追踪调查的追踪损耗情况如何、有多少是样本损耗、多少是总体损耗、中国的多重社会转型如何影响追踪损耗、如何提高追踪调查质量的问题。作者在对该项调查的追踪损耗数据进行分析的基础上,提出了追踪损耗随着中国社会的转型不断上升的“社会转型影响假设”、农村调查出现的追踪损耗误差大于城市的“城乡差异假设”,以及年轻人口由于外出就业和分家最终不会再被追踪到的“生命周期假设”。作者运用统计分析方法,从个人与家庭两个层面证实了上述三个假设,并对在中国社会转型背景下如何减少追踪损耗提出了自己的建议及相关方法( 梁玉成, 2011) 。
社会研究方法的价值集中体现在研究者接近和达到研究目标上。而研究者在研究中对研究方法的使用,既是体现研究者学术水平和能力的一个重要方面,也是其实现研究目标的重要保证。学术期刊作为研究者发表研究成果、进行学术交流的主要平台,还承担着对不同研究结果的检查、衡量、比较与评价的多种功能。
生命历程研究方法( life course research method) 是上世纪60 年代人生命事件。这些生命事件一般包括接受教育、离开父母独立生活、结婚或离婚、生养子女、参加工作或辞职、居住地迁徙、退休等。李强等人及时地将这一方法介绍到国内。作者在论文中就生命历程研究的基本概念、历史发展、分析范式、理论应用等问题进行了详细的综述,列举了生命历程研究在越轨社会学中的应用实例,并对生命历程研究中常用的“事件史分析”统计方法进行了深入的介绍。最后,作者对在中国场景下引入和开展生命历程研究的意义进行了阐述。作者认为,现代中国剧烈的历史变动和社会变迁与生命历程理论的基本视角相契合。离开对社会变迁对生命轨迹之影响的考察,很难对社会学视野中的中国人的生活、中国社会的结构变迁做出完满的解答; 同时,生命历程研究范式可以帮助我们从“小问题”来做“大文章”,即通过对普通人生活的关注、对一些具体社会过程的考察,来把握个人生命历程与社会结构变迁之间的互动关系( 李强等, 1999) 。
在“新计算社会学”( new computational sociology) 首次提出不到一年的时间内,《社会学研究》就发表了罗玮等人的介绍文章。作为在美国大学学习社会学的学生,论文作者参加了在美国举行的“新计算社会学研讨会”,在收集相关资料的基础上写成论文,向国内社会学界及时介绍了这一最新的社会学发展动态,特别是在大数据背景下,社会学与计算机科学、信息科学等相互结合的发展动态。作者借用美国社会学家的话指出,社会学的发展之所以艰难,主要是因为社会学在研究方法上经历了十分艰难的过程。而新计算社会学的目标正是要借助相关的新技术、新工具、新手段,克服以往社会学研究中存在的各种缺陷和障碍,提高社会学研究的科学性和有效性。在系统回顾这一艰难过程的基础上,作者详述了新计算社会学的五大相关内容: 即大数据的获取与分析、质性研究与定量研究的融合、基于互联网的社会实验研究、计算机社会模拟研究以及新型社会计算工具的研制与开发等。作者最后指出,从新计算社会学与传统社会学研究比较的角度出发,能够更好地认识新计算社会学的特性与发展前景( 罗玮、罗教讲, 2015) 。
随着计算机和信息技术的发展,特别是互联网的普及对人们社会生活的覆盖和渗透,它们对现实生活的影响越来越大。为应对互联网带来的虚拟环境对研究方法的挑战,学者们开始探索将互联网作为新的研究田野和工具进行定性研究的可能。虚拟民族志( virtual ethnography) 方法就是在这种背景下形成的一种用来探讨与互联网关联的社会文化现象的新的研究工具。卜玉梅从方法论的角度对此进行了介绍,从互联网与文化的关联出发,按虚拟田野的定位、在线参与观察的实现、线上田野作业向线下的拓展以及研究伦理几个方面,对虚拟民族志所牵涉的问题进行了梳理和评述。在此基础上作者指出,作为一种建基于传统民族志而又与之有所不同的研究方法,虚拟民族志首先挑战了传统意义上的“田野”,即将非实体的虚拟社区及其具体表现形态作为研究的田野。研究者和被研究者也不再是面对面的交流,因而参与观察的方法必须有所调整。同时,虚拟民族志方法的讨论也将随着互联网自身的发展以及研究的需要而变得日益重要( 卜玉梅,2012) 。
如果说定性研究方法与定量研究方法之争一直是社会学研究领域中的一大特征的话,那么,两类研究方法的混合运用是否必要,又是否可能呢? 针对这一问题,朱迪以其所做的消费模式研究为例,探讨了将定性研究与定量研究结合起来的混合研究方法。作者首先回顾了有关混合研究方法的若干争论,指出不同的定量与定性结合方法背后的本体论和认识论的含义也不同。在强调要了解混合研究方法所蕴含的方法论含义的同时,作者指出有关混合研究方法的争论实际上也提醒研究者,应当根据研究的目的、资料的类型、甚至研究者的资质来选择一种合适的策略,系统地连接资料和合适的资料分析方法。作者通过总结自己的研究发现指出,采用混合研究方法进一步丰富和深化了研究的结论,而且通过定量和定性研究方法的结合能够提高研究发现的可靠性和深入性( 朱迪,2012) 。
内生性问题是社会科学定量分析,特别是因果推断中所面临的一个关键挑战。解决内生性问题的常见方法主要包括工具变量( instrumental variable,简称IV) 、固定效应模型( fixed effects model,简称FE) 、倾向值匹配( propensity score matching,简称PSM) 、实验以及准实验( experiments and quasi-experiments) 等等( 陈云松, 2012) 。针对内生性问题及其解决方法,胡安宁对于近年来受到学术界重视的倾向值匹配方法的历史、发展及其对于社会学调查研究的意义进行了系统梳理。在此基础上,作者通过一个具体实例,展示了倾向值匹配方法的实施过程。同时,作者从密尔对因果关系的论述以及统计学的反事实框架( counterfactual framework) 出发,阐释了倾向值匹配方法是如何通过“控制”混淆变量、满足非混淆假设( unconfoundedness) 来帮助研究者提出因果性结论的。此外,作者还把倾向值匹配的方法与其他比较常用的因果推论方法,比如回归中断设计和工具变量方法等进行了简要的对比,展示出倾向值匹配方法相对于其他方法特有的优势。在文章的最后部分,作者简要分析了倾向值匹配方法的局限性,并对倾向值匹配方法的最新发展趋势进行了展望( 胡安宁, 2012) 。
作为解决内生性问题的另一种重要手段,工具变量也是基于调查数据进行因果推断的一种前沿方法。陈云松专门撰文对这一方法进行了介绍。作者用尽可能浅显的语言,简要说明了工具变量的定义、原理及估算方法,在此基础上,作者对实证分析中较为常见的五类工具变量进行了回顾和梳理,为今后的研究寻找工具变量提供了参考。同时,作者对工具变量估计量的权重性特征进行了阐述,并结合实例展示了使用工具变量进行因果推断的基本步骤和要点。最后,作者还就工具变量方法的潜力和局限性进行了剖析。他指出,“发现和使用工具变量,既能展示研究者具有一定的社会科学逻辑力、想象力和诠释力,但同时也会把研究最薄弱的环节( 无法验证的外生性) 直接展示给学术界。因此,工具变量既是展示社会科学想象力的舞台,也是可以让一篇论文失去价值的达摩克利斯之剑。从这个角度上来说,所有的工具变量方法使用者都应该小心谨慎,清楚地说明所需假设,清楚地说明一旦工具变量外生性假设不能满足,估计量会发生偏移的方向。只有这样,才能把理论上的直觉和前人使用工具变量的经验教训结合起来,让我们的逻辑、想象和诠释,为社会科学定量分析中的因果推断提供更强的说服力和更高的可信度”( 陈云松, 2012) 。胡安宁和陈云松两位作者对倾向值匹配和工具变量方法所进行的介绍和评述,对于国内学术界了解、认识和借鉴两种新的方法起到了很好的推动作用。
本文为原文节选,全文内容请点击阅读原文
发表于《社会学研究》 2016年第6期