元分析:本科生的平均智力水平仅为平均水平


研究发现大学生平均智商仅102分,与普通人群无异,且自1939年起每年下降0.2分。这一颠覆性结论挑战了“大学生智商高于常人”的流行观点,并对教育、就业、临床评估等领域产生深远影响。

颠覆认知:大学生平均智商仅102分 与常人无异 教育神话破灭

期刊:ScienceOpen Research
发表日期:2024年5月1日
原文标题:Meta-analysis: on average, undergraduate students‘ intelligence is merely average
作者背景:Bob Uttl (皇家山大学), Victoria Violo (不列颠哥伦比亚大学奥肯那根校区), Lacey Gibson (西安大略大学)

我们一直以为大学生是天之骄子

几十年来,老师家长社会大众都深信一件事:能考上大学的人,脑子肯定比普通人好使。流行的说法是,大学生平均智商在115到130之间。而普通人的智商平均值是100,标准差15。也就是说,大学生比一般人聪明一到两个档次。

这个信念听起来挺合理。毕竟在几十年前,上大学是少数人的特权。能进大学的人,当然是从智力金字塔顶端挑出来的。很多心理学教科书、科普杂志、甚至临床评估报告,都把这个数字当成事实来引用。比如有经典教材写得明明白白:大学毕业生平均智商115。还有心理学期刊上的图表,直接把“大学学历”对应的智商区间标成112到120。

但是你有没有想过一个问题:如果现在一半以上的年轻人都去上大学了,那大学生的智商还能比普通人高出一大截吗?如果大学生的平均智商真是115,而普通人平均是100,那剩下没上大学的那一半人,智商得低到什么程度才能把平均数拉回来?这个账算不过去。

几位心理学家决定动手查一查。他们不满足于引用几十年前的老数据,而是自己做了一个大规模的元分析。结果发现了一个让很多人跌眼镜的事实:今天的大学生的平均智商,只有102分。

这个信念是怎么传下来的

要搞清楚这个神话的源头,得翻一翻老黄历。最早的数据来自1940年代和1950年代。那时候,美国只有不到5%的成年人拥有大学学位。上大学的基本上都是社会精英阶层,他们的智力测试分数自然很高。

其中被引用最多的一份资料,是一家叫Wonderlic的公司出的手册。这家公司做的是智力测验,他们在1990年代早期的手册里写着:大学新生的平均智商是115,大学毕业生的平均智商是120。这个数字被很多心理学家反复引用,比如Gottfredson、Kaufman、Lichtenberger这些人,在他们的文章和书里都用了这个数据。

但问题在于,Wonderlic的那个“常模”其实根本算不上常模。它不是什么科学抽样得来的数据,而是各个公司随便把他们招聘时测的一些分数寄回给Wonderlic公司,然后Wonderlic公司把这些乱七八糟的分数汇总了一下。比如“教师”这个职业的所谓常模,来自于十家不知名的公司,总共五百个求职者的分数。这些人多大年纪、教什么科目、甚至是不是真的教师都搞不清楚。

更离谱的是,后来的学者在引用这些数据时,根本就没注意到这些数据已经过时了六七十年。他们就像传话游戏一样,你引用我,我引用他,最后大家都信以为真。比如有人引用Jensen,Jensen引用Cronbach,Cronbach引用更早的Plant和Richardson,而Plant和Richardson在1958年就总结说,大学生平均智商是120。这个数字距离现在已经快七十年了。

时代变了,智商分数也跟着变

如果我们真的想搞清楚大学生智商到底是多少,不能光靠翻老黄历。因为智商测试有一个特别有意思的现象,叫做弗林效应。简单说就是,人类的总智商水平在逐年提高。平均下来,每十年要提高大约3分。

这是什么意思呢?假设你在1950年做了一套智商测试,得了115分。如果你的后代在2022年做同一套题,他的原始正确题数可能跟你一样,但因为他这一代人整体都变聪明了,所以他的115分实际上只相当于你那个年代的93分。换句话说,测试本身变得越来越难了,因为参照的人群整体能力在上升。

韦克斯勒成人智力量表,就是心理学界用得最多的那种智商测试,从1939年第一版到2008年第四版,整套测试的难度一直在上调。数据很清楚:一个人如果在老版本上得了115分,到了新版本上可能只能得100分出点头。这个差异可不是小数目,是实实在在的十几个智商点。

但是那些宣称大学生智商115到130的人,完全没考虑这个效应。他们直接把1940年代、1950年代的测试结果,跟今天用新版测试测出来的分数做对比,这不等于拿尺子量身高但刻度是错的吗?

打个比方,就好像你拿1950年的工资标准说现在的大学生一个月能挣多少钱。那时候一个大学毕业生可能确实比普通工人挣得多几倍,但你现在还用那个比例套,说大学毕业生应该月入十万,这不是开玩笑吗。

上大学的人多了,智商自然就降了

还有一个更简单的数学道理。1940年的时候,只有不到5%的成年人有大学学位。到了2021年,接近38%的成年人都有大学学位了。如果算上至少上过一些大学的人,那比例超过60%。也就是说,上大学从少数人的特权变成了多数人的常态。

现在咱们来算一笔账。如果上过大学的人平均智商真是115,而普通人平均是100,那就意味着没上过大学的那部分人,平均智商必须低到不可思议的程度,才能把总平均拉到100。实际上根据智商的正态分布,这根本不可能。因为智商低于70的人在人群中只占大约2%,你再怎么拉也拉不动。

唯一的可能是,随着上大学的人越来越多,大学生的平均智商必然会向普通人群的平均值靠近。这不是什么猜测,而是数学上的必然。就像如果一个班原来只收尖子生,全班平均分很高。后来这个班扩招,把中等生甚至差一点的学生都收进来,那全班平均分肯定会下降。

数据也证实了这一点。韦克斯勒智力量表在不同年代的常模数据显示,大学毕业生在WAIS-R版(1980年)的平均智商是115.3,到了WAIS-III版(1996年)降到了111.6,到了WAIS-IV版(2008年)降到了107.4。那些上过一些大学但没毕业的人,下降得更厉害,从107.4降到了101.4。每过一年,大约下降0.27个智商点。

我们自己动手做了个大汇总

前面说的都是别人做的常模数据分析。为了得到更可靠的结论,这几位研究者自己动手做了一个元分析。元分析就是把所有能找到的相关研究都收集起来,然后用统计方法把它们的数字汇总在一起。

他们搜索了PsycInfo、ERIC、MEDLINE这些学术数据库,找所有用韦克斯勒成人智力量表测试大学生智商的文献。从最早的数据一直到2022年底。最后找到了106个样本,总共涉及9902名学生。这些样本覆盖了从1939年到2019年各个时期,用的测试版本从最早的WBIS一直到最新的WAIS-IV。

这个数据集很有意思。1939到1949年间有1486名学生,1950到1959年间有1462名,1960到1969年间有1938名,后面每个十年也都有几百到一千多名的数据。样本主要来自美国,但也有四个加拿大样本。

他们不光看原始报告的智商分数,还把弗林效应考虑进去,做了校正。他们还尽量找到了每个学校的学生在2021年的平均SAT分数,用来看看学校的选择性和学生智商之间的关系。

结果非常清楚。从1939年到2022年,大学生的平均智商一直在稳步下降。下降的速度大约是每年0.173到0.192个智商点。也就是说,八十多年下来,下降了大约十五六个点。

把这个趋势一直推到2022年,今天的大学生平均智商是多少呢?只有102分。换句话说,大学生跟普通大众比起来,已经谈不上更聪明了,就是普通人水平。他们不再是百里挑一的精英,而是大街上随便找个人差不多的智力水平。

不同学校和专业差别巨大

虽然平均水平是102,但这不意味着所有大学生都一样。不同学校之间,不同专业之间,智商差距可以非常大。

SAT分数就是一个很好的参考。虽然SAT不是纯粹的智商测试,但它跟智商测试的相关性非常高,高到0.8甚至0.9以上。SAT的阅读和数学部分,基本就是在测语言能力和逻辑推理能力,跟智商测试的核心内容高度重叠。

从SAT数据看,打算学教育专业的学生,无论是SAT总分还是数学和语文单项,都低于所有大学新生的平均水平。打算学数学或物理的学生,则比平均水平高出差不多一个标准差。一个标准差在智商尺度上大约是15分。也就是说,数学系学生的平均智商可能比教育系学生高出15分以上。

更直观的对比是,一个打算学教育的高中毕业生,SAT总分换算成智商大约101.6。一个打算学数学或统计学的,SAT总分换算成智商大约117.9。这两个人都被大学录取了,都是大学生,但他们的智商差距相当于普通人和所谓“天才”之间的差距。

学校之间的差距同样惊人。美国有大约两千所高校在IPEDS数据库里有录取学生的SAT成绩。加州的Caltech,录取学生的SAT总分中位数是1555,录取率只有6.7%。而很多录取率超过80%甚至接近100%的学校,学生平均SAT总分换算成智商可能不到100。也就是说,在这些学校里,超过一半的学生智商低于普通人平均水平。

这就好比你开一个餐馆,有人问你“你餐馆的菜好吃吗”。你说“平均来说还不错”。但实际上有些菜系的大厨是米其林级别的,有些菜系的大厨可能连盐和糖都分不清。你光说一个平均数,掩盖了背后巨大的差异。

这对大学教授意味着什么

如果你是一个大学老师,这个研究结果应该让你清醒一下。你教的学生,从智力水平上说,跟你在大街上随便找个人没什么区别。你不能再假设他们能轻松理解抽象概念、能快速掌握复杂逻辑、能自觉完成大量阅读和作业。

但现实是什么呢?很多教授抱怨学生越来越不准备、越来越不努力、能力越来越差,但最后的成绩却越来越高。五六十年代的时候,学生在课外每上一小时的课,要花两到三小时自习。现在的学生自己承认,每上一小时课,课外只学大约一小时。这是他们自己说的,不是别人冤枉他们。

与此同时,大学里得A的比例越来越高。在很多学校,A已经是给得最多的成绩了。按照大学章程里写的,A代表“优秀”,B代表“明显高于平均水平”,C代表“满意”或“平均水平”。如果大部分学生都得A,那要么是大部分学生真的都优秀,要么就是这个A已经失去了原本的意义。

教授们为什么给高分?不是因为学生真的变优秀了,而是因为他们害怕学生给的教学评价差。研究早就证实,给分越高,学生对老师的评价就越高。老师为了保住饭碗或者升职,只好不断给学生放水。结果就是,学生明明能力一般,却拿着漂亮的成绩单,以为自己是天才。

这就像一个健身教练,发现学员举不起来预定的重量,就把重量减轻,然后说你们都举起来了,真棒。最后学员拿着记录以为自己是大力士,实际上举的还是原来一半的重量。

这对雇主意味着什么

如果你是一个雇主,招人的时候习惯看大学文凭,那你可能需要重新考虑一下。过去人们认为,有大学文凭的人至少智商比一般人高,学习能力更强,解决复杂问题的能力更好。这个假设在几十年前成立,但现在基本不成立了。

平均智商102分意味着什么?意味着你随机抓一个大学毕业生,他的智商跟你随机抓一个高中毕业生,没有统计上的显著差别。当然,如果你从MIT或者Caltech招人,那另当别论。但如果你只是要求“有大学学历”,那这个门槛基本上等于没有。

有趣的是,已经有精明的雇主意识到这个问题了。加拿大政府,作为全国最大的雇主之一,允许求职者用一项智力测验来替代大学学历要求。你只要在90道选择题的通用能力测验里答对58道,就算满足要求,不需要文凭。美国也有越来越多的大公司,比如沃尔玛、埃森哲、IBM,开始取消部分岗位的大学学历要求。

这就像你家楼下的小区保安岗位,过去要求“退伍军人优先”,后来变成“有保安证优先”,最后变成“身体健康就行”。不是退伍军人变差了,而是这个岗位本身可能并不需要那些特殊资质。同样,不是大学生变笨了,而是大学文凭已经不再是稀缺信号。

这对临床心理学家意味着什么

这个研究最尖锐的批评,是冲着临床心理学家去的。在法庭上、在伤残鉴定中、在教育评估里,心理学家经常需要评估一个人的病前智力水平,也就是这个人在生病或受伤之前大概有多聪明。常用的方法之一就是看他的教育程度。比如说,这个人上过大学,那就推测他病前智商应该在115左右。

这几位研究者发现,这种做法在今天的科学证据面前站不住脚。他们举了一个真实的案例。在加拿大的一起人权诉讼中,三位注册心理学家作证说,一名小学教师的智商太低,无法胜任工作。他们用的对比数据是什么?是1940年代和1950年代收集的军人智商数据、Wonderlic公司那个来路不明的职业常模、还有Gottfredson在1990年代画的智商分布图。

这些心理学家完全没有考虑弗林效应。如果他们稍作校正,就会发现那些对比数据在校正后,平均智商只有97到98分。而那位被评估的教师,用最新的WAIS-IV测出来是86分和91分。虽然偏低,但并不是他们声称的“低于教师平均水平两个标准差”。实际上,如果考虑教师专业的SAT分数本来就低于所有专业平均线,91分可能并不奇怪。

更离谱的是,其中一位心理学家给这位教师做测试的时候,记录写着该教师当时在呕吐、身体不适、隔壁房间还有噪音干扰。在这种条件下测出来的分数,能代表正常水平吗?

这个案例揭示了一个严峻的问题:一些心理学家在用老掉牙的数据做生死攸关的判断,而且完全不知道自己在干什么。用研究者的话说,不校正弗林效应就使用过时的测试常模,不仅是非科学的,而且在某些司法判例中已经被认定为不合格执业行为甚至 malpractice。

这些老数据为什么还在用

你可能会问,既然这些老数据问题这么大,为什么还有人用?原因有几个。第一是路径依赖。心理学教科书几十年来一直在抄来抄去,Gottfredson的文章被引用了上千次,Kaufman的书是经典教材,大家都信了,没人去查原始数据。第二是惰性。校正弗林效应需要多做一步计算,很多人懒得做或者不会做。第三是利益。有些人靠这些数据吃饭,比如在法庭上作证的心理学家,他们引用老数据显得被评估的人特别差,这正好符合雇主或者保险公司的利益。

但问题是,如果一个人的人生、工作、前途、甚至生命都取决于这些评估,那用几十年前的老数据来下判断,就跟用1950年的医疗手册给现在的病人开刀一样荒唐。Reynolds等人早在2010年就说过:没有人应该因为一份智商测试是何时修订的而影响他的生死。这几位研究者补充说:也没有人应该因为某个专家用了八十年前的老数据而丢掉饭碗。

这个研究的局限和未来的方向

当然,这个研究也有它的局限。首先,绝大多数样本来自美国,加拿大的样本只有四个。虽然美国和加拿大的教育普及趋势相似,但加拿大的人口构成和移民政策不同,可能会有些差异。现有数据显示,加拿大的智商与教育程度之间的关联比美国弱,所以加拿大大学生用加拿大常模测出来,平均智商可能比美国还低一两分。

其次,这个元分析只包含韦克斯勒量表。但好消息是,另外两种常见的智力测验也发现了同样的下降趋势。Wonderlic测验的数据显示,大学生平均分从1970年到1992年持续下降,到2022年已经降到相当于智商102分的水平。Shipley-2测验在2008年常模化的时候就已经发现,上过大学的人平均智商就在100分上下。所以这不仅仅是韦克斯勒量表的问题,而是普遍现象。

第三,SAT和ACT的数据可能不够全面,因为不是所有学生都提交成绩。但这些考试的成绩与大学录取率高度相关,基本能反映学校的选拔性。而且各种研究都确认,SAT和ACT跟智商测试的相关性非常高,用它们做参考是合理的。

未来需要更多针对不同国家、不同文化背景的类似研究。也需要研究这种智商下降对大学教学效果、对劳动力市场、对社会流动性的长期影响。但目前已有的证据已经足够强烈,不容忽视。

总结一下,别再骗自己了

说了这么多,核心结论其实就一句话:大学生不再是天才,他们就是普通人。

从1940年代到现在,上大学的人从少数精英变成了大众普及,大学生的平均智商从115以上降到了102。这个下降是每年0.2分,持续了八十年,数学上必然,数据上确凿。不同学校、不同专业之间差距很大,但整体平均水平就是普通人的水平。

这对教授意味着:你得面对现实,别再用老眼光看学生。对雇主意味着:大学文凭不再是智力的保证。对学生意味着:你能进大学不代表你是天才,别太膨胀。对心理学家意味着:别再拿1940年代的数据来做评估,那样既不科学也不道德。

至于那些教科书、科普文章、专家报告里还在反复念叨的“大学生智商115到130”,就当它是老古董吧。听着有趣,但不能当真。就像你奶奶说她当年一分钱买两个鸡蛋一样,那是她那个年代的事,现在你拿一分钱去超市试试看。

时代变了,大学不再是天才的俱乐部,而是普通人的新常态。这不丢人,也不可怕。可怕的是明知道变了还假装没变,用老标准去衡量新人、做错决定、毁掉别人的人生。数据就在那里,该更新脑子了。