花这么多时间、智力、财力、人力做量化研究,只因为科学研究的利器是实验,而统计分析是实验的可靠代用品。科学研究,终极目标是发现因果关系。人与其他动物的区别,就是人类能发现因果关系,能应用关于因果关系的知识提高生存能力。动物的生存也有策略,比如,狮子捕猎时有分工、合作,有埋伏、佯攻、拦截,这种集体行动能力,既是狮子的本能,也靠观察和练习。与动物相比,人的巨大优势是有更清晰的分工和计划,清晰的分工和计划靠的是对因果关系的认识,而认识因果关系离不开科学。人类可以搞登月工程,其他动物搞不了。登月工程的背后,是对巨量因果关系的科学认识,出一点差错,就会造成严重后果。例如,飞船重新进入大气层时会因为摩擦产生高温,正是靠对相关因果关系的准确认识,工程师们才能准确选择飞船外壳用的保护涂料、决定飞船进入大气层的角度,而这些决定直接关系到宇航员的安危。
哲学家们对因果关系讨论很多,这些讨论,是很精巧有用的智力体操。不过,自然科学家的学术训练严谨,他们做研究的基本程序就体现了对于因果关系的深刻理解,所以,他们不大理会哲学家争论什么,除非他们自己也是哲学家。在我们这个时代,需要在认识因果关系上补课的,倒往往是哲学家,更准确些说,是靠在大学课堂讲哲学的人,也就是叔本华嘲讽的“靠哲学谋生的人”。这些人,在思维上很容易两头落空,既不掌握科学研究的方法(天知道他们何以自信有资格指导科学研究),也未能保全常理和常识。他们心中的哲学,来自把鲜活的哲学思想变成标本的哲学教课书,而不是来自重要哲学家那些自成生态体系的经典著作。他们可以鹦鹉学舌,慢慢学会一套话语,虽然不懂话语的意义,但能运用纯熟。学这套话语的代价是失去常识,失去常理。
实际上,只要理智健全,单凭常识,我们也知道因果关系很复杂,认识因果关系很不容易。我们可以从最朴素的角度看因果关系。因,原因,是一个事件。一个人大汗淋漓,忽然跑进了一个冷窖,这是个事件;一个儿童八岁时开始进学校接受教育,这也是个事件;学童的教育持续了一段时间,这也是个事件。果,结果,也是个事件。伤风感冒,是个事件;开始识字,是个事件;书本知识由少变多,也是个事件。一个事件先发生,另一个事件一定随之发生;一个事件不发生,另一个事件一定不发生;二者相加,就是前一个事件与后一个事件一一对应(one-to-one correspondence)。逻辑学家喜欢用术语,把一一对应关系叫做当且仅当(if and only if,或iff)。(其实,老老实实把“if and only if”译为“如果并且仅仅如果”,比较好懂,但专家们不喜欢,也许是觉得生硬,食洋不化;“当且仅当”不大好懂,至少不如“if and only if”好懂,但专家们喜欢,好在一旦与英文对上号,“当且仅当”朗朗上口。这样的翻译有为渊驱鱼的积极功能)。两个事件一一对应,二者之间就可能有因果关系。注意,只是可能有因果关系。确立因果关系,需要科学程序;确立一一对应关系,也需要科学程序,不能依靠常识。原因是,单凭常识不能超越现实,在现实世界中,永远不可能观察到一一对应关系,现实世界永远是个多元嘈杂的混沌世界,无数事情同时发生。英国哲学家休谟有个著名论证,揭示常识的不足。他说,早晨,太阳升起,这是一个事件;过几个小时,夜间冰冷的石头变暖了,这是另一个事件。凭常识,我们觉得太阳升起继而高照是原因,石头由冷到暖是结果。但是,休谟说,这需要证明!理由是,在这几个小时中,宇宙间并非只有这两个事件,相反,有无数个事件在同时发生,凭什么说是太阳升起继而高照导致了石头由凉变暖?我主张石头变热的真正原因是鸟鸣,你怎么反驳?请注意,休谟并不简单怀疑常识,他只是提醒我们必须从怀疑走向相信,不能始终相信。另一位英国哲学家弗兰西斯·培根,是近代经验科学方法的创始人之一,他说:伟大的哲学,始以怀疑,终于信仰。这句话让张中行先生纠结了一生。他觉得自己有始无终。不过,张先生是幸运的。有始有终,固然高明;有始无终,收获机会;无始有终,虚度一生。
回到正题。现实世界混沌一片,这是常识。凭借这个常识,我们就知道,试图认识因果关系,试图发现一一对应关系,必须发现和排除三大干扰:一果多因,一因多果,虚假因果。要做到这一点,需要超越常识,需要开展科学研究。科学是一种认识方法,是严密的分析方式,主要手段是做实验,做实验是为了判断一个事件与另一个事件是不是一一对应。做实验时,科学家尽最大努力严格控制实验环境,让被假设是原因的事件发生,不让被假设是干扰因素的事件发生,然后看被假设是结果的事件是否发生。自然科学家以实验室为工作坊,甚至为家,原因就是科学研究离不开实验。
社会科学向往称为科学,但社会科学以人的各种社会属性为研究对象。但是,严格意义的实验,基本上都不能用在人身上。用在人身上的实验,都是打了折扣的,不严谨的实验。例如,为了检验新药是否有效,现代医药学往往做双盲实验,双盲实验就是一种打了折扣的科学实验。双盲实验有个关键程序,就是实验组和控制组(对照组)的人,除了是否服药,其他方面最大程度相似。首先必须最大相似的,是两组人在生病这个属性上最大相似。两组人其他属性上的最大相似,依靠的是个抽样程序,叫做随机化,randomization。随机化就是自然化,就是最大限度地保持自然状况,或者说,最大限度地保持做实验之前的自然状态。具体点讲,在双盲实验中,随机化,就是让两组个体,除了在自变项(是否吃药)和因变项(病情如何变异)上有系统的共同变异,其他方面的变异都是随机的。其他属性的变异是随机的,它们对于因变项的影响就可以互相抵消。(顺便说一句,比较研究方法,即求同法、求异法、求同求异法,也是实验的代用品。)例如,检验一种感冒药是否有疗效,对照组与实验组的人必须都患了感冒,并且是得了同一个类型的感冒,如果症状有轻有重,轻重的分布在两组人中要最大程度相似。我们知道,感觉得到了医治,可能产生已经得到医治的信念,如果对医治者有强烈信心,进而会相信自己必将痊愈,这个信念可以激活人体休眠的免疫功能,产生疗效。为了排除这种心理暗示作用,有个专门程序:实验组吃的真药与控制组(对照组)吃的安慰剂(placebo)外表完全相同;负责协助服药(或服安慰剂)的护士也不知道哪个是药、哪个是安慰剂,以免被善于察言观色的人发现自己吃的究竟是不是药。这么复杂的随机化程序,跟前面讨论的抽样程序相似,目的是保证实验组和控制组的人,除了在吃药与否上有区别,其他方面最大程度相似。在这样的安排下,如果吃药的那组人(实验组)与吃安慰剂的那组人(控制组或对照组),感冒症状的变异有“显著的”差异,那就证明感冒药起了作用,因为其他可能影响感冒症状的因素都被排除了(术语听起来比较恐怖:都被控制住了)。当然,差异可以是“症状减轻”,也有可能是“症状加重”。至于什么是“显著”,请看第四章。
双盲实验是打了折扣的科学实验,统计分析更是等而下之,只能算科学实验的代用品,类似义齿、义肢。社会科学研究,除了纯粹研究认知或反应问题的实验心理学,很难做严格的科学实验,连打了折扣的双盲实验也很难做,只能采用统计分析方法。我们可以设想,在市场经济下,与在计划经济体制下相比,各行各业劳动者的敬业程度比较高。这是个简单的假设,但不能做实验验证。有人建议设立文革省,就是划出特区,在特区内实行文革时的种种制度,请那些怀念文革的人搬到他们心中的人间天堂。这个建议,背后的假设是,那些口头怀念文革的人,只是停留在口头上,经不起检验,一检验就会暴露他们口是心非。如果能把这个设想付诸实施,是件很有趣的事,可惜这个设想只是笑话。社会科学家能设计精巧的实验,然而不能付诸实施,只能用统计分析作为代用品,这不是他们的错,是因为作为研究对象的人极为特殊,有众多不可侵犯的权利。比如,口头怀念文革人,有拒绝接受测谎的权利。公共健康研究,很接近新药的药效测试了,但也不能做实验。举个例子,我们常说抽烟会影响健康,导致疾病,心脏病也好、肺癌也好,反正是致命的病。但是,怎么证明这个假设?最科学的办法是做实验。我们可以设计一个科学实验,在人口中随机抽取若干1000对儿同卵双胞胎人士,把他们(她们)随机分为两组,实验组1000人,控制组1000人。分在实验组的必须每天必须定时抽一定数量的烟,分在控制组的则不准抽烟。为了控制非生理因素对健康的影响,这些双胞胎必须做同样的工作、住同样的地方、生活习惯也必须完全相同。这样的实验可以有力证明抽烟是否有害健康。但是,不言而喻,除非是在法西斯统治下,这样的实验没有可行性,根本做不了。可是,公共健康问题太重要了,学者们必须研究。于是他们退而求其次,利用统计分析作为实验的代用品。在现实中,有些人抽烟,有些人不抽烟,不用强迫,也强迫不了;有人得肺癌,有人不得肺癌;这一切都是自然发生的,相当于自然实验。量化研究,可以抽样,抽到的样本中,自然会有抽烟的和不抽烟的,被抽进样本的烟民的资深度自然变异(因人而异),进入样本的人的健康状况也自然因人而异,把这些实质相干的和理论上相关的信息收集起来,然后分析是否抽烟这个属性(其变异可以在定比层级测量)和患肺癌这个属性(其变异也可以在定比层级测量)有没有非随机的、系统的相关性,有没有一一对应关系。