智商测试:现代人的偏见

在早期的智商测试中,女孩的分数在每一个年龄段都高于男孩,心理学家为此非常焦虑。美国曾有12个州通过了对智力缺陷人群实施绝育手术的立法,27个州实施强制绝育计划。

文/大象公会

塑造神童的人总喜欢拿爱因斯坦作标杆,或许因为他的名字已成为“天才”的代名词。“英国13岁女童智商160,堪比爱因斯坦”,类似标题屡见不鲜。

但这种对比的说服力极低,智商测试不是通考。市面上最为流行的韦氏、斯坦福-比奈、瑞文测试各有评分标准,儿童与成人的试题也不相同。

更重要的是,爱因斯坦生前并没有接受过智商测试,虽保留了大脑,也无法用此估算属于心理学概念的智商——除非大脑复活,亲自做一次智商测试。

实际上,爱因斯坦的智商值来源于1926年凯瑟琳·考克斯和路易斯·特曼所做的300位历史天才早年智力的估算。对这些智商测试发明前的人物,考克斯的研究方法相当粗暴:阅读传记细节,替他们做当时流行的斯坦福-比奈(Stanfor-Binet)智力测试题。

考克斯的结果或许令喜欢拿它对比的神童们失望:爱因斯坦的智商只排在中游,远低于斯图亚特·密尔的190、笛卡尔和伽利略的180,只与诗人艾略特持平。唯一超过200的人叫弗朗西斯•高尔顿,他并没有前几人的名望,但他有特殊的身份:智力测量的先行者,考克斯和特曼的学术偶像。

尤为值得一提的是,在智商测试的改进过程中,无论其注重考察何种能力,它始终是一个为现代社会标准而设置的游戏。在某种意义上,它很难摆脱现代人的偏见。

【智力测试的进化】

长期以来,智力高低都是仁者见仁,没有精准、抽象的标准。工业革命后,惊叹于科学定理效力的人们,开始将目光转向以往含混不清的领域,智力就是其中之一。

“200分先生”高尔顿是这方面的先行者。1859年,阅读了他表哥达尔文的《物种起源》,高尔顿深受刺激,决定测量人类的智力,用精确的数据证明他的优生学设想:人的智力由遗传决定。

高尔顿很快开工了。他试图在听力、手的灵敏度、中指长度、头颅大小等要素间,找到与智力高低的相关关系。结果令人失望,这些因素完全无法解释智力的差异。不过,这些失败的举措开启了量化智力的尝试。

法兰西斯·高尔顿

1881年,法国开始推广义务教育。为区分普通儿童和有缺陷儿童,教育部门急需合适的检测工具,以便因材施教。需求刺激下,法国的阿尔弗雷德·比奈和西蒙在1905年制作了第一份智力测量表,并在1908年的修订中,创造性地按不同的年龄段设计了试题,提出了心理年龄概念。相比较后人,比奈没有宏伟的野心,他清楚地强调他的测验只能测量部分智力,对预测有学习困难的儿童可能有效。

接下来,改进智力测试的交接棒传到了美国。20世纪初,这个生机勃勃的国家里,征兵、移民、教育,都急速扩展,成千上万的学历不明,各式背景的移民蜂拥而入,迫切需要更有效率的区分方法,在混乱中整理出秩序。

同时,应用心理学正在美国快速的发展,人们相信,心理学家可以搞定一切:婚姻失和,工作不满,推销保险。于是被法国人漠视的比奈测试在这里大放异彩。战争的爆发催化了狂热需求,智商测试就在这个背景下大踏步地走入美国人的生活。

1916年,路易斯·特曼,就是给历史名人估算智商的考克斯的导师,修改了比奈-西蒙测量表,将新版本命名为斯坦福-比奈智力测试。特曼吸收了1911年德国人威廉·斯特恩提出的智力商数(IQ)概念,根据不同年龄儿童做测试的分数均值,设为“智力年龄”标准,每个儿童的个人智力数值,取决于心理年龄与生理年龄的比率。这种测试方法被称为比率智商,公式如下:

所以,高尔顿智商被测为200,是考克斯和特曼认为他3岁就能完成达到正常儿童6岁的斯坦福-比奈智商测试水平,同理,爱因斯坦的传记等材料被认为只能体现1.6倍的心理年龄/生理年龄比。

此后,智商测试不断进化。1949年,韦克斯勒编制了不同于比奈系列的新测试表,称为韦氏智商测试,影响至今。韦氏测试分为成人、儿童、幼儿三版,采用离差智商计算,将同一组的智商平均值设为100,标准差设为15,整组的数据呈正态分布。与比率智商不同,离差智商不计算不同年龄的成绩比率,而将挑选出来的同年龄人作常模参考,表示个人在同年龄组的相对位置。

这种新的参照方法也影响了斯坦福·比奈智商测试。在1960年第三次修订时,它也采用了离差智商,但其标准差为16。这意味着高智商的分数,在韦氏测试应为130,在斯坦福·比奈测试则为132。

所以,即使考克斯的传记估算法合理,媒体上介绍可与爱因斯坦媲美的聪明的少年时,也该先确定几个问题:你使用哪种测试?成人组还是少儿组?标准差多少?参考的常模又是哪些?

【什么是智力】

智商测试首先取决于对“智力”的理解。早期智商测试的短板在于:应用先行,缺乏理论。此后,智力理论层出不穷,但是最核心的问题:什么是智力,智力的结构,遗传和后天因素对智力的影响,依旧充满争议。

最初,对智力本质的探讨来自英国心理学家斯皮尔曼,1904年他提出了常规智力和特殊智力之分。常规智力被称为g因素,它被认为是智力的关键。斯坦福·比奈测试就主要集中于g因素的测量——反应速度、记忆力、语言能力、计算能力。

这种解读的方法,将智力解析为各种能力。但只关注静态能力,容易落入穷举的泥潭。到1980年代时,它已细分到了240种因素。

认知心理学兴起后,学者提出了信息加工理论,不再斤斤计较于静态的划分,更注意智力处理现实问题的能力。按此类理论,人脑被理解为信息处理系统,智力体现于为了一定目的,加工处理信息的表现。

于是,将因素和信息加工调和在一起的智力层面理论出现了——既划分了不同因素,又注重因素在信息加工中的表现。在这种视角下,一些心理学家将以往不被重视的能力纳入视野,不局限于传统的狭隘定义。

哈佛大学的加德纳在1983年提出“多元智能”概念,一改以往强调抽象思维的智力观念,将人际关系、音乐、肢体动作等加入智力范畴。著名的情商概念也在此时提出。1991年,萨洛维提出的情绪智力(EI)概念,认为认知、控制情绪的能力,是一种长久以来被忽视的智力。经过戈尔曼的传播,情绪智力广为人知,逐渐被传播为情商(EQ),和智商并列。

智力理论的发展,影响了智商测试的项目,斯坦福-比奈量表的测试能力,从最初的g因素,到后期的8种,其测试结构在数量和内容也发生变化。

斯坦福-比奈智商测试五次修订的内容变化

认知神经科学的发展,又给智力理论提供了新的支撑。目前,学界倾向于认为大脑突触更多的人,智力表现更好,大脑皮质的厚度也与智力相关。除了从脑部构造角度探讨,认知神经科学还在确定人脑的信息加工速度、知觉速度、神经速度等功能与智力的关系。

不过,这些神经科学角度的尝试也受到“智力”概念的困扰,对人脑哪一部分的扫描?都只能够确定相关关系进行推论,更进一步的探讨,则都需要理论标准。

未来智商理论会有什么发展,技术上能否用脑部扫描等手段取代智商测试,抑或证明智商测试的合理性,仍是未知数。理论的发展推动人们更理性的看待智商测试,因为人类曾有滥用测试的深刻历史教训。

【智商测试的滥用】

1927年,美国最高法院以8:1的投票结果,判处弗吉尼亚州对一名“弱智”妇女实施绝育手术。著名的霍姆斯大法官曾对此评论道:“三代弱智已足够”。此后,美国12个州通过了对智力缺陷人群实施绝育手术的立法,27个州实施强制绝育计划。最热衷于此的加利福尼亚一共实施了2万多例手术。

登峰造极的是纳粹德国,近40万人被判定智力缺陷,强制绝育。还有十余万人被杀害。

更早的时候,美国医生在移民到达的地点,仅凭交谈和观察,就评估他们的智商分数,弱智者将因此被遣返。1924年,受智商检测结果的影响,美国国会出台了更严格的移民控制法案。

这种滥用智商测试的现象引起了人们的警觉,最著名的反对者是李普曼 (Walter Lippmann)。1922年,他在《新共和》杂志上与特曼打了一场笔战,李普曼抓住当时智商测试的弱点,批评其简单粗暴的对待复杂的人类智力,总是偏重某些能力,只能得出偏见,容易给个人贴上永久的标签。

当时智商测试值得诟病处甚多。比如早期的斯坦福-比奈测试中,女孩的分数在每个年龄段都高于男孩,这让路易斯·特曼很焦虑,1937年,新版本的测试量表删除了男性得分差的项目,轻轻一动,男孩就和女孩一样聪明了。

1960年代的美国,民权运动风起云涌,智商测试被认为是种族主义的方法,受到活动家的冲击,纽约、华盛顿特区、洛杉矶等市禁止对小学生智商测试,不过随着民众热情的消退,这种激进的禁令很快被取消了。

随后,智商测试不断完善,早期的很多问题已经解决。但接下来,它又面临更大的麻烦:弗林效应。

这是由美国人詹姆斯·弗林命名的现象,它显示,在1930年到1980年间,发达国家的智商测试初始分数一直在上升,比如1932年至1978年,美国年轻人的IQ平均指数提高了14点。弗林效应也出现在发展中国家。1994—1998年间,肯尼亚6—8岁农村儿童的分数增加了11分,这让人怀疑智商测试的稳定性,也与智商测试体现先天智力的观念不符——基因的变化不可能这么快。

目前,多数心理学家将此解释为随着社会进步,教育和营养水平提高,影响了抽象能力的发展,而对于弗林效应本身引起的智商测试有效性讨论,则莫衷一是。

【中国人的智商】

尽管多数中国人1980年代以后才接触智商概念,但智力测试方法早在1917年就传入中国。1917年京师教育报上,翻译了日本学者佐藤礼云关于比奈-西蒙智力测试的介绍文章,并附上部分测试题目。

当时智力测试的介绍以翻译为主。中国最早的智力测验尝试,是1918年瓦尔克特用斯坦福-比奈智力量表测验清华的学生。两年后,南京高等师范开设心理测验课程,正规的智商测验出现。随后,比奈量表、美国陆军智商测试表等被翻译过来,在20年代风靡一时,报刊杂志经常出现“智力小测验”的题目。

很快,中国部分学校也各自开始智力测试。1921年,安徽第二师范附属小学对学生进行了智力测试,试题选自比奈-西蒙测试表。1926年,厦门集美学校对女小学部的一次智力测验,并将结果发布在《集美周刊》上。

《集美周刊》截图。T分数为特曼(斯坦福-比奈)测试,B分数为比奈-西蒙测试。

此时的智商测试只是在一些学校出现,分布很散。报刊上虽然时常出些智力小测验,但正规的智商测试远没有普及。1931年,中国测验学会成立,一项主要任务就是协调各地的智商测试。

但这种势头很快被打断。1949年后,中国心理学界开始接受辩证唯物主义和苏联心理学改造,“反右”期间,智商测试因为是“资产阶级方向心理学”遭全面中止。1965年,姚文元在《光明日报》撰文,批判心理学为“资产阶级伪科学”,虽然同一时期,资产阶级的美国青年也在严厉指责心理学为“种族主义”帮凶。

高考恢复后,为研究中国科大等“少年班”的神童现象,学界重启了智商测验。1980年代初,韦氏成人智力量表和斯坦福-比奈测验表的中国版制定出来,成规模的智商测试变为可能。

对民众来说,对智商的了解更多的来自于大众传媒。1980年代中期开始,报刊和电视上“智商”概念不断提及,人们将智商作为智力的同义词,用以表示“聪明”,“机智”。

不过,中国人对智商测试始终不曾狂热过。中国人所熟悉的爱迪生的名言是“天才是百分之九十九的汗水加上百分之一的灵感。”而爱因斯坦一连做了三个小板凳的故事,也曾进入小学的教科书,以此告诉学生们勤能补拙。

而情商概念一经传入中国,就迅速替代智商,成为解释成功者的最重要特质。虽然上世纪80年代以来,人口开始自由流动,但传统熟人社会中的背景和关系仍是当下的典型话语,人脉网络被视为是改变命运的最主要途径。与西方国家不同,中国式的英雄主义也不建立在超众的个人能力之上,而更强调个人为集体所作的牺牲。

您可能还喜欢…

发表评论

邮箱地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>