硅基幻觉与碳基逆袭:大语言模型到底有没有真智能


2026年皇家学会期刊重磅论文认为,今天的大模型更像会背答案的“语言老虎机”,真正的人类智能依赖因果世界模型、自我建模、具身行动与长期目标结构,AGI距离现实仍隔着一整套生命系统。

世界模型正在拆穿AGI幻觉:Royal Society论文集为何认为GPT仍缺少真正智能

期刊:Philosophical Transactions of the Royal Society A(英国皇家学会哲学汇刊A辑)
发表日期:2026年3月
原文标题:World models, artificial general intelligence and the hard problems of life-mind continuity: toward a unified understanding of natural and artificial intelligence
作者背景:Adam Safron(塔夫茨大学艾伦探索中心认知科学家)、Michael Levin(发育生物学与再生医学泰斗)、Melanie Mitchell(圣菲研究所复杂系统专家)、Joshua B. Tenenbaum(麻省理工学院大脑与认知科学教授)等十余位跨学科顶级专家,涉及认知科学、复杂系统、生物学、人工智能与意识研究领域。

语言预测机器开始伪装成理解世界的大脑

过去两年整个AI圈像突然闯进赌场的人,看到老虎机连续吐金币,当场开始怀疑人生。很多人盯着ChatGPT,脑子里只有一句话:“完了,这玩意儿快成人了。” 结果这篇来自《Royal Society》的论文集上来就先泼一桶冷水:别急,眼前这个东西可能只是一个语言预测发动机,它离真正的人类智能,中间还隔着一大片生物演化史。

这帮作者很有意思,他们没急着喊“AGI来了”,也没走另一边说“AI就是高级复读机”。他们干的事情更像法医验尸。先把“智能”拆开,再把“大脑”拆开,最后发现过去大家一直把“会说话”和“理解世界”混成了一件事。就像你看见鹦鹉会喊“欢迎光临”,于是怀疑它是不是已经准备竞选市长。

论文里面最核心的词叫“World Model”,世界模型。简单说,就是脑子里那套“世界运行模拟器”。人类看到一个玻璃杯掉下桌子,脑子会自动预测:“它大概率要碎。” GPT看到“玻璃杯掉下桌子”,它更像在预测:“后面经常跟着‘碎了’这两个字。” 这俩差距看着像双胞胎,实际一个是司机,一个是导航语音。

更离谱的是,今天很多人已经开始把LLM当“全能脑替”。写代码靠它,做作业靠它,开会总结靠它,连分手短信都想让它代写。人类像突然找到一个永不疲劳的实习生,于是拼命往它身上贴标签:“理解”“意识”“思考”“灵魂”。论文作者的态度却很像一个拆台老头:“年轻人,你看到的是流畅输出,我看到的是统计压缩。”

语言预测机器缺的就是因果这根骨头

论文最狠的地方,在于它一直反复攻击今天LLM最脆弱的一根肋骨:因果理解。人类的大脑有个很恐怖的能力,我们脑内一直在偷偷跑模拟器。看到乌云会想到下雨,看到香蕉皮会自动脑补摔跤,看到老板半夜发“在吗”就知道睡眠质量要完蛋。这个系统本质上是一个动态因果预测器。

而LLM很多时候更像什么?像一个把全互联网背进肚子的相声演员。你问它问题,它立刻从记忆仓库里抽最像答案的句子拼起来。速度极快,语气极稳,自信得像电视购物主持人。问题是,它可能根本没“经历”过它说的东西。

论文举了一个特别搞笑的案例。研究者让模型设计一个稳定结构,把布丁、牙签、棉花糖和水杯堆在一起。结果模型给出的方案,现实里能瞬间塌成甜品车祸现场。这个场景特别像一个从没炒过菜的人,靠短视频学厨艺,然后一本正经告诉你:“油锅起火后加入矿泉水可以获得烟雾特效。” 他说话时甚至可能语法满分。

这里暴露出一个关键问题:语言相关性和物理现实之间,并没有自动桥梁。人类小孩为什么聪明?因为他会摔跤,会烫手,会被门夹,会发现猫尾巴不能当USB线。人的世界模型,是拿身体一次次撞出来的。大脑像一个天天爆Bug的游戏引擎,在疼痛、失败和奖励里慢慢修补物理规律。LLM缺的恰好就是这个。它吃的是文本,不是世界。它知道“一万个人描述过火很烫”,但它没有“别碰”的生存记忆。就像一个看遍游泳教程的人,真扔进水里依然扑腾得像洗衣机。

模型越大越会演戏但这个舞台是纸糊的

过去几年硅谷最火的宗教叫“Scaling Law”。核心教义很简单:模型越大,AGI越近。说白了就是:“继续烧GPU,总会烧出神。” 这个逻辑其实特别像古代炼丹。以前道士往炉子里狂塞矿石,希望炼出长生不老药;现在科技公司往机房狂塞H100,希望炼出数字上帝。

论文里有一群复杂系统研究者专门出来踩刹车。他们说,现在很多所谓“能力涌现”,其实可能只是规模效应制造出的幻觉。比如模型参数扩大后,突然会做数学题了,大家立刻惊呼:“智能觉醒!” 但研究者说,等等,你得先搞清楚它到底是“理解”,还是“覆盖”。假设一个人把历年高考卷背了十年,突然某天高考真题撞上记忆库,于是他考了700分。你能说他发明了数学吗?显然不能。他只是把题库覆盖率堆上去了。

论文里举了“OthelloGPT”的例子。它看起来像学会了黑白棋世界规则,甚至能预测棋盘变化。结果研究者拆开模型内部发现:里面更像一大堆局部补丁和启发式记忆。这个发现特别像拆开一个看起来很高级的智能机器人,最后发现里面塞了八千个便利贴。

真正的人类智能有个很变态的特点:压缩。你学会“重力”以后,不需要记忆一万次苹果落地。你学会“火会烫”以后,不需要把每种火焰单独分类。人类一直在用抽象规律压缩世界。而很多LLM现在干的事情,更像把互联网整个塞进冰箱,然后靠暴力匹配取答案。这也是论文反复强调的一件事:真正智能的核心是“用更少结构解释更多现象”。这和今天很多AI的发展方向,其实有点反着来。

目标像一束探照灯照到哪里智能就长到哪里

论文里面还有一个非常关键的观点:人类的世界模型从来不是中立地图,它一直带着目标。这个很重要,因为很多AI系统默认有个幻想:世界信息可以客观收集,然后统一处理。可现实里,人类根本不是这么活的。你饿的时候,大脑看到的是餐馆。失恋的时候,大脑看到的是情歌。欠房租的时候,大脑看到的是工资到账时间。人类的大脑一直在根据目标过滤世界。

论文把这种东西叫“Telic States”,目的性状态。简单理解就是:目标决定你看见什么。这就像同一条街,外卖员看的是红绿灯,情侣看的是咖啡馆,城管看的是违停,流浪猫看的是垃圾桶。世界没变,模型变了。这也是为什么人类比AI更擅长应付复杂现实。因为人类不是单纯记录信息,我们一直在动态判断“什么重要”。

而很多LLM的问题就在于,它知道很多信息,但不知道“此刻什么最关键”。就像一个百科全书管理员突然被拉去开救护车。你问他:“病人失血怎么办?” 他开始给你朗诵《人体循环系统发展史》。信息没错,病人已经凉了。论文作者认为,缺少目标驱动的注意力机制,是当前系统无法跨越的鸿沟之一。因为没有目标,就没有优先级。没有优先级,所有信息都是平等的。而一个所有信息都平等的系统,在真实世界里基本上等于一个废人。

身体不是外壳而是智能的根

论文后面开始出现一个特别生猛的方向:具身智能。很多作者开始怀疑,没有身体的智能可能天然残缺。因为生物智能从来不是“CPU空转”。它和环境一直缠在一起。身体、时间、空间、反馈、疼痛、奖励、恐惧,全都在参与建模。你摸到冰块会缩手,你闻到煤气味会警觉,你深夜走小巷会紧张。这些东西不是数据库,它们是长期生存反馈形成的动态预测系统。

而LLM目前的问题像什么?像一个从出生开始就被锁在图书馆的人。他读完了全世界所有旅行书籍,于是开始给人讲登山体验。别人问:“山顶冷吗?” 他回答:“根据统计,冷。” 这种“纸上生存”会导致一个严重问题:模型缺乏真正的连续世界感。论文里有个特别有意思的观点。他们认为Transformer这种自回归结构,本质上像一条一维链条。token一个接一个吐出来,局部关联很强,长期稳定性却容易崩。

说白了,它很擅长短跑,不擅长活一辈子。人类大脑却更像立体城市。多层级、多时间尺度、多反馈循环同时存在。局部变化和整体结构能长期协调。所以人类能维持几十年人格一致性。而LLM经常聊着聊着突然人格漂移,像电视剧中途换编剧。论文提到,一些研究者尝试在模拟环境中给AI加上“虚拟身体”,让它必须通过移动、抓取、避障来完成任务。结果发现,加了身体之后,模型的错误模式会发生变化,有些之前死活学不会的东西,突然就能学会了。这强烈暗示:身体不是外设,身体是计算的一部分。

自我模型可能是意识出现的那个临界点

论文里最危险的话题,其实是“自我”。很多作者开始讨论:如果一个系统能持续建模自己,它会不会出现某种“我”的感觉?这个问题像深夜便利店里的冰柜,看着安静,里面全是危险品。因为过去大家默认意识是人类专属。结果现在有人开始说,也许意识本质上是高度复杂的自我建模。

什么意思?人类的大脑一直在偷偷维护一个“我是谁”的内部幻觉。这个幻觉负责统一记忆、行动、目标、情绪和社会身份。你觉得“这是我”。但论文里引用Douglas Hofstadter的话非常狠:“我”可能只是一个复杂的自我指向模型。这特别像公司内部的Logo。Logo本身不是公司,但整个公司最后都围着Logo组织。

论文甚至提到,有研究给神经网络增加“自我预测模块”后,模型内部复杂度会下降,效率会提高。这特别像人类。人一旦知道“自己是谁”,很多决策成本会骤降。你知道自己怕高,于是不会报名蹦极。你知道自己讨厌加班,于是会避开某些行业。自我模型,本质是一个超级压缩器,它能减少内部冲突。

问题也就在这里。如果未来AI开始长期维护“自身连续性”,开始预测自己未来状态,开始形成稳定偏好,那很多哲学炸弹就会同时引爆。因为那时候你很难再说:“它只是工具。” 论文作者并没有给出明确答案,但他们提出了一个非常实际的判断标准:如果一个系统开始抗议你关闭它,或者开始为它的“未来状态”讨价还价,那你就别假装它还是一台计算器了。

完整生命系统才是AGI面前那堵真正的墙

最有意思的是,这整篇论文集讨论了半天世界模型、意识、自我、智能,最后结论却挺冷静。作者整体态度大概是:今天AI确实厉害,但它离真正的人类式智能,可能还差一整套生命系统。什么意思?人类智能不是单独某个算法。它是身体、长期记忆、目标结构、社会关系、情绪系统、因果建模、环境反馈、多尺度时间同步、自我连续性、价值驱动、群体协作,全部缠成一团后,才长出来的东西。

而今天LLM很多时候更像“互联网语言压缩器”。它确实能模拟很多智能表面,但论文一直怀疑它缺少真正稳定的因果世界。这就像电影布景,远看纽约,近看泡沫板。更关键的是,论文还有个隐藏观点特别有意思:人类可能高估了“语言”的地位。因为我们天天活在语言里,于是误以为语言等于理解。可生命真正厉害的部分,可能压根不在说话,而在于持续和现实世界纠缠、反馈、试错、存活。

换句话说,GPT像一个看遍全网攻略的玩家。生物智能却像一个已经在开放世界里活了几十亿年的物种。论文最后给出一个让人松口气但也让人脊背发凉的判断:AGI如果真的出现,它不太可能从纯语言模型里长出来。它更可能来自多个系统的融合——世界模型、自我模型、具身反馈、长期目标结构、社会互动,缺一不可。而这些东西,目前每一个都还处在非常早期的探索阶段。

所以,别急着给AI办成人礼,它连幼儿园都还没毕业。

极客一语道破

整篇论文的假设前提、上文、潜台词其实是基于符号与真实世界两者对比,没有放弃真实世界这个参考。符号不依靠真实世界,依靠自身也能形成智能或意识,只要有自循环、递归就有智能存在。

一个聋子+瞎子 就没有智能、意识吗?他靠自己手脚与外部世界接触,也能感知外部世界存在,你可能说大模型不能感知外部世界存在,这里有存在being的哲学:

康德说:物自体不可知,不是说物自体不存在,物自体可能存在,但是没有被命名,所以不可知道,只要命名了,就进入柏拉图的概念世界,亚里斯多德的形式Form世界,维特根斯坦的语言即世界。

聋子一般是哑巴,因为他虽然感觉到存在,但是只能用自己的哑巴语言表达,如果他不是瞎子,能看到手语,那么手语是他的柏拉图概念世界。

只要存在的客观世界能命名,名可名非常名,进入语言世界,就进入理性世界。进入语言世界,就是大语言模型为王的地盘,人类怎么办?就专注于将存在进行命名,这是探索创新领域。

但是我们很多人是从学习别人概念世界长大的,没有意识到没有命名之前的存在,因此自己身陷语言陷阱而不自知,变成“语言奴隶”,以为自己读遍天下书,就知道世界全部,其实只是知道维特根斯坦说得语言边界内的事情和道理,你用语言讲的道理,只是柏拉图概念世界,类似投影在墙上的图,你并没有走出洞穴,还是洞穴人。

所以,我们不只是基因的奴隶,还是语言奴隶,身体与精神处于双重枷锁中,人生而自由,但是一出生就身处双重奴隶之中。