必也正名乎
中国的社会学界,常常听到对 “定量”或“量化”的批评,最近好像又有一些声音。我认为,批评可以,但首先有必要区分一下“定量”和“量化”,因为它们实在不是一回事,尽管写成英文都是quantitative.
Quantitative只是个一般意义上的形容词,跟数量有关的就都是 quantitative;但“定量”和“量化”这两个译法,却十分敏锐地抓住了即便在英语训练中也无人强调的两种不同的含义。我的理解是这样的,所谓“定量”,就是“定于量”,也就是把数值确定下来。这样的数值,本身就是有意义的,这个意义不是修辞意义,而是实在意义。也就是说,它们本身就是问题的真实答案。因此,定量研究问题通常直截了当——中国女性一生平均生多少孩子?美国各类跨种族通婚率分别是多少?某职业培训政策导致目标人群的劳动参与率上升多少?诸如此类。
我和我的合作者曾使用中国西北地区的调查数据写文章,因为涉及家庭观念,想要引用一下回汉通婚率,结果,大量的文献只是说这个有影响、那个有影响,就是没有通婚水平。也就是说,这是一个有人感兴趣、却尚未被解决的定量问题,于是我们另写了一篇文章,用小普查算出回汉通婚水平,并描述和诠释了其地域差异和历史趋势。
对于这类需要用数值去直截了当地回答的问题,如果一定要去附会什么理论,那就是犯了八股病。当然了,稍作铺垫也不是不可以,毕竟搞学术是要适当踩一踩巨人肩膀的。但老实说,假如让我去读一篇关于高等教育回报率的定量文章,我会跳过人力资本理论(如果有的话),先翻到后面去看那个百分比,而且我不觉得这样做有什么错。
刚才说了,定量研究要定的量,本身就是问题的答案,而好的定量研究,就是重要问题的正确答案。什么问题重要,各花入各眼,但有一点是肯定的,那就是定量研究不吝于把功夫花在技术细节上。既然做定量,就是要追求精确,如果硬要说这是方法主义,那也无法可想。举个例子,中国的总和生育率到底是 1.18 还是 1.65,这是个很重要的、值得反复推敲的问题,在这个问题上,进一寸不但有一寸的欢喜,还有远超一寸的价值。定量研究的人文关怀,就在于把数算对,不夸张地说,这是一个操守问题——实际上,很多令人尊敬的定量研究使出100%的力气,只是为了把结果的质量提高1%。
那么,什么是“量化”呢?顾名思义,就是“化为量”,即先把概念化为变量,然后探索变量之间的关系,最后再上升到理论。在我看来,量化与定量不同,量化研究中的数值不具有实在意义,它们只是对诸概念及其关系或精致或粗糙的模拟。换言之,量化是一种基于数量的修辞。在这一层,量化和质化方法并没有本质区别,二者都是为讲故事而服务,其核心策略都是构建 metaphor,不过前者求诸数量关系,后者求诸语义之网而已。
我无论是读量化文章,还是自己写,最重视的部分是研究假说,因为那是故事的纲领。如果故事不好,后面的统计分析再怎么精益求精,也是白给(这才是方法主义);反过来,如果故事特别好,那么数据分析只须套路演足、中规中矩,对具体数值一般不必穷究。很多人都会同意,读有些文章的分析结果,究竟是 0.5 还是 0.6、一颗星还是两颗星,都没什么要紧,只要结果大致合于研究假说,就算是为故事提供了基于量化修辞的“经验”证据。这种文章,自然就是量化文章。
再植入一则广告吧,我和一个朋友最近合写了一篇量化文章,前半部分从中国的社会和历史背景推出四条叙事性的研究假说:1)当代中国人的发展观受到国际主流发展话语的影响,呈现高度的一致性;2)即便如此,西北穆斯林和非穆斯林汉族的发展观仍有显著差异;3)西北穆斯林基于宗教认同,对伊斯兰国家的发展程度有着更高的评价;4)除了这一宗教因素,穆斯林和汉族人的发展观就没有显著差异了。其实,文章到这儿已经定调了,剩下的就是使用一个600多人的样本,跑出各种OLS回归、中位数回归、多层线性模型,依次证明这四个假说成立。我相信,即便读者没弄明白后面的技术细节,也不影响她/他搞清楚我想说的故事——只是说服的效果要打个折扣。我还相信,如果我手上不是一个调查样本,而是一套访谈数据,也可以讲出同样的故事。
总而言之,定量和量化虽然统称 quantitative,实则大异其趣。定量旨在事实,逻辑和经验密切辨证,直来直去,向目标结果步步逼近;量化旨在理解,理论与证据互相发明,温文尔雅,把一个故事娓娓道来。同样是数,定量研究中的数有其独立的重要性和真实性,若数字确信可靠,要把它当作事实记住;而量化研究中见到的数,不过是为了实现论证目的修辞碎片,重要的是它们背后的意思,读完文章,只要对议题增进了理解,具体数字完全可以忘掉。定量研究不依赖过多的理论铺设,其重要性不证自明,只要把问题问清楚,甚至连研究假说也是多余;然而量化研究的灵魂却在于理论动机,其数据分析部分若无研究假说加以规约,则无异于盲人摸象。