专栏名称: 新京报书评周刊
新京报书评周刊2003年创刊,每周六出版发行,口号是“阅读需要主张”。书评周刊气质是严肃而有趣,主要评价国内外出版的大众类优秀图书。
目录
相关文章推荐
十点读书  ·  人到五十,迷上豪门霸总 ·  4 天前  
经典短篇阅读小组  ·  钱钟书先生用自己的经验告诉你怎么读书才不容易忘记? ·  6 天前  
51好读  ›  专栏  ›  新京报书评周刊

升个小学竟要测父母智商?IQ测试根本就是错的

新京报书评周刊  · 公众号  · 读书  · 2017-05-21 08:43

正文

近日,幼升小的一系列考试题引起广泛关注,原因是这些题竟是出给学生家长的。

5月6日上午,有网民反映,上海民办阳浦小学和青浦世界外语学校在学生面谈过程中,让家长做起了调查问卷,其中包含智商测试题和父母三代信息的收集。虽然阳浦随即作出声明,说家长可自由选择填或不填,做问卷调查的目的是为了寻找教学规律等,但其用意之一或许就是,根据家长智商的测试情况帮助自己选择更优秀的生源。

此类行为的背后隐藏着“遗传决定论”思想。该理论几乎忽略了环境、教育、后天努力等作用,将天生的智商看作单一的等级量表,且不可改变。这就意味着,人一生下来,社会阶层便是固定的。此外,背离智商测试初衷的使用,更是值得我们反思。

美国著名进化论科学家斯蒂芬·杰伊·古尔德在《人类的误测:智商歧视的科学史》一书中,便详细梳理了智商测试相关研究的历史脉络及其社会影响,剖析了对智商测试背离初衷的误用现象,并用事实和论据对这一行为进行了严密的反驳。



比奈首创智商测试表

拒绝把IQ视作对孩子排序的手段


当巴黎大学心理学研究室主任阿尔弗雷德·比奈首次决定研究智商测量时,他顺理成章地关注保罗·布洛卡的研究(用测量颅骨大小的方法分析人的智力,认为被测者的智力和他们的脑容量之间的关系是真实存在的——编者注)。




阿尔弗雷德·比奈(1857-1911),法国实验心理学家、智力测验的创始人。


但5项关于学龄儿童头骨的调查研究,动摇了他最初的坚定信念。比奈来到不同的学校,让老师选出最聪明和最愚笨的学生,并用布洛卡建议的方法,对这些学生的头部进行了测量。他写道:“我深受其他科学家研究的影响,并带着这样一种观点开始研究,即智力上的优越性与脑容量的优越性紧密相关。”
 
在研究中,比奈发现了差异,但这些差异微不足道。比奈说:“带着在聪明人和一般人的脑容量之间寻找差异的目的去做头部测量,我担心这会导致我在测量中无意识而又真心实意地增加聪明人的脑容量,而减少一般人的脑容量。” 他意识到,当偏见潜藏而科学家却都相信自己的客观性时,就会存在较大的潜在危险性。


1904年,比奈受公共教育部长委托,开展了一项有特定目的的研究:寻找一种可以识别在普通课堂上未能取得成功的孩子的方法,以表明这些孩子需要某种特殊形式的教育。比奈采取了一种完全务实的方式。他汇集了一系列与日常生活相关的简单任务,据说这也涉及一些基本的推理过程,比如指导才能、理解力、创造力、批评(改正)。像阅读等学习过的技能,不会直接出现在测试中。


上海幼升小家长测试题之一


比奈给每个年龄段都分配了对应的任务,每项任务都是这个年龄段年纪最小、拥有正常智商的孩子能够顺利完成的。参加比奈测试的孩子,从最小年龄段的任务开始,按照顺序依次进行测试,直到不能再完成任何任务为止。能够完成的最后一项任务对应的年龄,就是孩子的“智力年龄”,而其整体智力水平,则通过真实年龄减去智力年龄得到。如果某个孩子的智力年龄远低于实际年龄,那么就会被认为是需要接受特殊教育的。这样,比奈完成了教育部交给他的任务。1912年,德国心理学家 W. 斯特恩指出,应该用智力年龄除以实际年龄来计算智力水平,而不是从实际年龄中减掉智力年龄,智商或者说IQ就这样诞生了。


比奈的确想在自己的测量中“区分天生智力和后天教育”,然而,除了想要消除学校知识对测试的影响这个明显愿望之外,比奈拒绝界定或推断每个孩子所得分数的意义。比奈宣称,智力是一个很复杂的概念,不能仅仅通过一个数字说清楚。这个数字,后来被叫作IQ,只是一个粗略的东西,完全根据经验的指导而得出,并出于一个有限的实用目的而创立:确切地说,这个量表并不能用来测量智力,因为智力特性是不能叠加的,因此不能像测量平面那样测量智力。


比奈不仅拒绝把IQ标记为先天智力,还拒绝把它视作一种可以对所有孩子按照智力价值排序的常规手段。他设计量表只是基于有限的目的,即为了完成教育部委托的任务,为了识别他们(需要特殊教育的孩子),方便让他们得到帮助和提高,而不是为了给他们贴个标签并限制他们的发展。



总的说来,比奈在使用自己的测试时坚持了三项基本原则。然而,后来美国的遗传论者忽略了他的所有警告,并且推翻了他的意图。他们把比奈量表翻译成书面形式,并作为一种测量所有孩子的常规方法。比奈的三项原则包括:


1.分数是一个实用数值,它们不支持任何智力理论。它们不能表明任何先天或者永恒的东西。我们不能说它们测量的东西就是“智力”,或者是其他任何具体存在的实体。


2.这种测量只是粗略的、经验主义的引导,目的是识别轻度弱智和无学习能力的需要特殊帮助的孩子。它不是对正常孩子划分等级的方法。


3.不论这些需要帮助的孩子存在困难的原因是什么,重点应该放在通过特殊训练而使其得到提高。低分不能作为孩子天生低能的标志。

比奈量表被误用

IQ被确立为排列人类社会等级的指标


如果遵循了比奈的原则,并且确保按照他所设想的方式使用测试,我们这个世纪可能就会免遭一次严重的科学误用。


智力测试的误用主要是由两个谬论引起的:具化论谬误和遗传论谬误,它们被那些想利用测试维持自己社会地位和优越感的人热切拥护。遗传论的谬误主要存在于以下两个错误暗示中:


1.把“遗传的”等同于“必然的”。对一个生物学家来说,遗传性指某些特征或倾向通过基因传递而沿着家族线路传播。他们很少提及这些特征受环境影响的程度和范围。基因没有创造我们身体的点点滴滴。此外,即使一种特征建立或确定了,环境干预仍然可以修正遗传缺陷。数百万美国人通过配戴眼镜矫正了天生的视力缺陷。全面教育可以提高我们在通俗意义上所谓的“智力”,认为IQ具有多少比例的“遗传性”与这种观点并不冲突。有些遗传的低智商也许可以通过适当的教育得到很大程度的提高,而有些也许不可以。然而,它仅有的遗传事实并不能推断任何结论。


2.种群内和种群间的遗传困惑。遗传学理论产生的主要政治影响,不是从推测的遗传测试中产生的,而是来自逻辑上的无效扩展。 通过传统的方法,比如对比亲属的分数,或者分别对比收养的孩子与生物学和法律意义上的父母的分数而进行的IQ遗传性研究,属 于“种群内”类型——也就是说可以在一个单一相关的人种内部评 估遗传性。有个普遍的谬误构成了这样的假设, 即如果遗传性能够解释种群内部个体间存在的某种差异,它也就能在同种程度上解释种群间平均智商存在的差异——例如白人和黑 人。但是,种群内部的个体差异与种群间的平均差异,是完全相互独立的现象。对其中一方的研究,并不能用来评测另一方。


亨利·戈达德(1866-1957),美国变态及临床心理学家,优生学的早期提倡者,认为智力落后德原因主要是遗传因素。


亨利·戈达德是第一个在美国普及比奈量表的人。他把比奈的文章翻译成英文,并应用和推广他的测试技术。测试能够很好地辨认处于正常智力范围之下的人群——也就是戈达德新命名的傻瓜。在这一点上,戈达德与比奈实一致的。但他们的相似之处也仅此而已。比奈拒绝把测试分数定义为“智力”,并希望通过识别而为孩子提供帮助。戈达德则认为,这些分数是对天生的、单一实体的测量。他希望通过辨识而认定界限,隔离群体,并为了阻止处于危险境地的美国血统继续恶化(这种威胁来自外来移民在国内广泛繁育的弱智人群)而主张剥夺外来移民的生育权。


想想为轻度智障设定的普通数值所涉及的情况吧:普遍低下的智力障碍,因局部神经损坏造成的特定学习障碍,环境劣势,文化差异,以及测试者的敌意等等。想想可能存在的潜在原因吧:功能模式的遗传,非家族遗传的基因突变,母亲孕期疾病导致的先天性大脑损伤,胎儿及婴儿期营养不良等等。但对戈达德来说,智力年龄在8到12岁之间的所有人都是傻瓜,都应该用大致相同的方式对待:接受谨慎的制度化管理,为了让他们高兴而满足他们的部分要求,而最重要的是,阻止他们繁育后代。


戈达德进行调研时拍摄的,住在新泽西松林荒地的卡里卡克家族成员照片。为了制造邪恶或愚蠢的外表,戈达德对照片进行了处理,突出了被拍摄者的嘴巴和眉毛。


戈达德把比奈表引介到美国,但特曼才是最早普及它的设计师。1916年,特曼把比奈量表扩展到“优秀的年轻人”,并把任务增加到了90项。特曼当时已是斯坦福大学的教授,于是给自己的修订版起了一个新名称——斯坦福-比奈量表,这个词成了所有后续“IQ”测试的标准。


特曼在1923年的广告这样写道:如果学校采用以下测试,在30分钟内进行的5个测试将会显示孩子的一生。他说,弱智在社会中是无能为力的,他们不仅在经济上,而且在其他方面,都是一种负担而非一种资产,因为他们有成为少年犯或者罪犯的倾向。


大众智力测试的一份广告,使用的是有特曼和耶基斯参与编写的考试题。


借着第一次世界大战的契机,罗伯特·耶基斯在军队中进行了超大规模的智力测试,让IQ在美国完全建立。在一战期间,耶基斯作为上校军官,对175万新兵做了智力测试。有文化的新兵做一种笔试,叫作军队阿尔法测试。文盲和在阿尔法测试中失败的人做一种图像测试,叫军队贝塔测试。在贝塔测试中失败的人会应召做一种个人测试,通常是比奈量表的某个版本。军队心理学家会为每人确定一个等级,按照A到E的顺序排列(每个等级又增设“+”“—”等级),并为他们在军中的恰当位置提出建议。耶基斯认为,C-等级的士兵被看作“低于平均智力——普通二等兵”。D等级的士兵“基本不适合担任需要特殊技巧、前瞻深谋或保持警惕的任务”。D和E等级的士兵不能“阅读或理解书面的指令”。


军队测试在某些领域产生了强烈的影响,并伴随耶基斯的概要统计报告被进行了普遍宣传。当时是耶基斯助理、后来成为著名心理学家的波林从档案中挑出16万个案例而构建的数据,在20世纪20年代产生了遗传论的重重回响,持续影响着美国的社会政治生活。这种影响直到现在还未得到完全改变。


人类的误测

作者:斯蒂芬·杰伊·古尔德

版本: 重庆大学出版社 2017年4月



本文内容整合自人类的误测》第五章,由出版方授权使用,有删减。整合与编辑:张进。未经授权不得转载。



直接点击 关键词 查看以往的精彩~


梅贻琦 | 彭浩翔 | 语文试卷 | 母亲节 | 林奕含 | 女性与饭局 | 钱理群 畅销书 高考恢复40年 周作人 | 衡水中学 | 读书日 | 不想工作 | 民的名义 | 平庸之恶 | 假课文 | 养猫 | 自闭症 |  法律与舆论 | 春日赏花 | 原生家庭 | 2084 | 婚外恋 | 性教育 | 古典诗词 | 刷热点 | 安·兰德 | “爱国主义” | 共享单车 | 胡适 | 国学低俗化 | 弟子规 | 2016年度好书 | 人生无意义 | 朋友圈 黄永玉 | 高房价 | 篡改历史 | 抑郁症 | 沈石溪 | 心灵鸡汤 |


扫描图中二维码,向李开复提问  

点击“读原文去我们的微店看看呀~