今年给三本经典认知科学读物写了推荐序,近期第一本正式上市了,是弗林教授的《智力是什么——超越弗林效应》一书。是的,就是三十年前,引发了认知科学史上智力大争论的弗林效应。
在过去一个世纪中,智商测验的分数逐年显著提高,这一现象被称作「弗林效应」。
弗林教授正是弗林效应提出者。在这本经典作品中,他描绘了一副新的人类智力图谱,阐述了智力到底是什么,以及现有智商测验的缺陷。我写的封底推荐语如下:
人类正在变得越来越聪明吗?是的。智力可以提高吗? 当然可以。不仅如此,如果你将智力看做一成不变,还会阻碍学习。就像欧洲中世纪信奉地心说的人们一样,当下人类智力观还停留在地心说时代,认知科学家们正在发起 21 世纪新的智力革命。在这场声势浩大的智力革命中,弗林是最重要的科学家之一,正是弗林效应帮助我们重新思考智商测验的问题以及人类智力本质。欢迎你阅读此书,从智力的地心说时代步入日心说时代。
人类变得越来越聪明了吗?在这个牛人辈出的世界,我们该选择什么样的生活方式?
人类变得越来越聪明了吗
1984 年 11 月的一个星期六,一位年已五十的心理学家在新西兰一所高校翻阅数据。他收到同事发来的荷兰两代十八岁少年的智商测验结果。他注意到一个奇怪的现象,相同的测验,那些 1982 年的孩子的得分,比 1952 年的得分高多了。人类是否在变得越来越聪明?这位心理学家好奇地给同行们发了封邮件,向全世界各地的研究者申请数据。综合来自不同国家的数据后,他发现了一个人类智商变迁的小规律:
每年智商提高 0.3% 左右,每十年提高三到五分左右。每三十年提高十二到二十个点左右。
这就是著名的弗林效应(Flynn effect)。这位好奇的心理学家就是弗林(Flynn)。1987 年,弗林收集 14 个国家的不同时期智商数据,在《心理学公报》(Psychological Bulletin)发表论文
Massive IQ gains in 14 nations: What IQ tests really measure
。
当时恰逢美国反思教育平等与种族主义的高峰期。另一位心理学家理查德(Richard J. Herrnstein)与合作者 1994 年出版了一本智商专著:《钟形曲线》。理查德在书中提出 1)低智商人群容易出现各类犯罪与反社会行为;2)相对于白人与东亚人,非裔美国人各项智商测试成绩越来越低;3)美国最低智商人群是一个印第安人保留区等。因此,作者们宣称:1)智商测验测试的特质是可靠的;2)这些特质是由我们的基因决定的,稳定且难以改变。
这样的结论,在今天看来纯属胡说八道,因为理查德的结论容易推论:白人必然比黑人高明。但在当时,理查德们更在书中公开建议:减少外国人移民到美国,避免全国平均智商降低。
《钟形曲线》一出版即为畅销书。黑人与白人是否真有先天差异,成为美国当时热门议题。弗林效应在这个公案中,也经常被各路板砖人士引用。但与理查德相反,弗林是一个坚定的种族平等主义者,研究智商的目的是为了捍卫自己的种族平等观念。毕竟人类越来越聪明,凭什么阻止黑人移民呢?凭什么相信黑人的智商不如白人呢?凭什么不给黑人提供更好的教育环境呢?凭什么不能相信黑人智商在更好的教育环境下会提升呢?
解释弗林效应的原因有很多。除了以往弗林提到的环境改善、生育技术改善、教育与对智商测验的熟悉之外,在他 2011 年新作《智力是什么?——超越弗林效应》与 2012 年新作《我们变得越来越聪明了吗?》中,弗林日益相信一种新解释,就是
那些 1% 的由基因带来的智商卓越的人,会主动去寻找更多新鲜刺激、更复杂的多元化工作环境,慢慢地,这些 1% 的遗传优势扩大为 99% 的优势,遗传给下一代,通过个体指数在个人层面扩大,通过社会指数在社会继续扩大。
什么是标准九
成为历史公案焦点的「钟形曲线」是什么呢?它就是被高斯、高尔顿等无数人誉为上帝曲线的正态分布曲线。达尔文表弟高尔顿叹道:「我几乎不曾见过像误差呈正态分布这么激发人们无穷想象的宇宙秩序」。如下图所示:
「正态分布」的概率密度函数曲线,因形状似钟形,被称之为钟形曲线;又因被高斯首先用数学证明,也称为高斯分布。如果有机会让我们穿越到 1809 年,与高斯一起玩个高明的思想游戏:假设上帝是个苦逼的造人实验科学家,他进行大量造人实验。每次实验结果都会出现误差,比如人类的智商、身高、胆固醇含量等,那么这些误差将如何分布呢?
高斯,这位站在上帝旁边的宇宙观察者总会发现:
无论上帝造人实验结果怎么偏差,一位「好」的人,必然是趋近算术平均值的
。那么反过来,我们推导这些误差分布,就可以得出以下结论:误差分布的极大似然值必然就是等于算术平均值。当已经明确知道,人类的智商、身高、胆固醇的误差分布的最终走向是算术平均值,那么,反过来推导出正态分布的公式就变得容易了。
继续沿着历史长河漫溯,来到第二次世界大战的年代。这个年代正是心理学大出彩的年代。当时美国军队普遍采用心理测验选拔将士,如何提高心理测验结果的易读性就成为刚需。首先是美国军方采用标准九体系来表示测验分数,接着,心理学家开始普遍将人格测验、智商测验的结果解释降级为个位数,即标准九体系。
什么是「标准九」(Stanine)?它是将正态分布曲线划分为九个部分,平均值为 5,标准差为 2,除了标准一与标准九两级之外,各个分数的范围全部都是半个标准差。如下图所示:
这样有什么好处呢?首先,它让我们更好地理解测验结果,心理学家对普通用户解释时,不用说你的「宜人性」是 68 分,而是说你的「宜人性」是 7 分;不用说你的智商是 115,而是说你的智商是 7 分;用户马上就明白自己处在一个什么样的区间。其次,它能让我们更好地整合不同来源的测试结果。一般来说,在平均数加减两个标准差以内的是正常群体,在此之外是需要格外注意的极端值。最后,它更符合大脑是个认知吝啬鬼的习惯。我们难以清晰地认识到智商 135、100 分的孩子有什么差异?但是,标准九与标准五的孩子区别一目了然。
社会比较会带来什么影响
标准九对我们有什么启发呢?一般来讲,拿到标准七分(以下简称为标准七)以上的那批人只有极少数,拿到标准八的人只有 7%,拿到标准九的人只有 4%。事实上,大多国家的教育却不是按大多数普通人标准制定,而是精英导向。为什么要让标准五的人与标准九比较,让标准五努力成为标准九?