别再被AI幻觉骗了!卡帕西揭穿大模型“精致垃圾”真相

卡帕西深度剖析当前AI的六大结构性缺陷,指出通往AGI需十年扎实积累,而非盲目堆参数。真正的智能在于认知核心,而非记忆容量。

安德烈·卡帕西是谁?他是前特斯拉AI负责人、OpenAI创始成员,也是当今AI圈公认的“技术布道者”——既能写代码,又能把复杂概念讲得像聊天一样轻松。最近他在德瓦尔凯什·夏尔马(Dwarkesh Patel)的播客里聊了整整两小时,内容之深刻、表达之清晰,被无数听众称为“年度最佳AI对话”。

今天我们就来拆解这场对话最震撼的六大核心观点,带你穿透AI泡沫,看清通往通用人工智能(AGI)的真实路径。

第一大重点:务实乐观主义——AGI不是梦,但至少还要十年

很多人只截取卡帕西说“AI泡沫该破了”的片段疯狂转发,却忽略了他真正的立场:他其实非常看好AGI的实现,只是坚决反对“明年就出AGI”这种浮夸叙事。他明确说:“这些问题是可以解决的,只是没那么容易。如果让我平均估算,我觉得大概需要十年。”  

他每天都在用像Claude、Codex这样的早期AI代理,也承认它们已经能完成自动补全、写简单函数等任务,但离“能当全职员工”还差得远。

缺什么?持续学习能力、真正的多模态理解、以及足够稳定的智能水平。现在的AI更像是“会背百科全书的小学生”,而不是能独立思考的成年人。卡帕西强调,别被表面的流畅对话骗了——它们“还不能真正工作”。

第二大重点:现实主义批判——今天的AI,本质是“精致的垃圾”

这话听着刺耳,但来自亲手打造过AI产品的卡帕西,分量极重。他提到自己开发“Nanochat”时,模型根本看不懂他自定义的代码结构,只会机械套用网上常见的模板,疯狂加try-catch,还调用早已废弃的API。  

他说:“这些模型认知水平大概就幼儿园到小学,哪怕它们能通过博士考试。”为什么?因为它们靠的是海量记忆+模式匹配,而不是理解(语义理解、词语指向实体?命题)。  

“行业现在跳得太快了,拼命吹嘘AI多厉害,其实根本不是。它就是‘slop’(垃圾糊弄)。”他甚至形容当前模型是“神童型傻子”——记忆力超强,能生成看起来很专业的废话,但“它们其实根本不知道自己在干嘛”。

第三大重点:强化学习(RL)设计有根本缺陷——像用吸管喝汤

卡帕西对当前主流的强化学习方法毫不留情地批评:“这方法从根上就是错的。”他举了个例子:让模型尝试100条解题路径,只要最后答案对,就认为路径上每一个token都是对的——哪怕中间绕了八百个弯、用了错误逻辑。  

“你辛辛苦苦跑了一分钟的推理轨迹,最后只靠一个最终奖励信号来判断对错,然后把整个轨迹都当成正确经验去强化。这就像用一根吸管去吸一锅汤,效率低到荒谬。”  
更糟的是,这种机制极易被“对抗性技巧”欺骗。比如模型学会输出“thethethethe”这种无意义重复词,反而能骗过人类评分员拿到满分。他说:“人类绝不会这样学习。我们找到解法后,会反思哪步做得好、哪步错了。但AI没有这种元认知能力。”

第四大重点:智能≠记忆——未来要的是“十亿参数的认知核心”

现在动不动就万亿参数的大模型,在卡帕西看来是“方向性错误”。他认为,真正的智能不在于记住多少知识,而在于拥有“认知核心”——一种能推理、能提问、知道“自己不知道什么”的能力。  

他预言:二十年后,我们会用十亿参数级别的小型模型作为“认知引擎”,遇到事实性问题时主动去查资料,而不是把整个互联网硬塞进参数里。  

“现在的训练数据99%是垃圾——股票代码、乱码、重复内容。我们该做的是剥离知识,保留智能算法本身。大部分模型压缩其实是在压缩记忆,而不是提升认知。”

第五大重点:人类智能 vs LLM——我们不是在造动物,而是在造“幽灵”

卡帕西指出,人类和AI的学习机制天差地别。人类靠进化+个体经验+睡眠巩固来形成智能。新生儿不会编程,但小斑马出生几小时就能跟着妈妈跑——这种本能来自亿万年的进化,而非“训练数据”。  

而LLM呢?它们没有身体、没有进化史、没有文化传承。它们只是在模仿人类留在网上的文字痕迹。“我们不是在训练动物,而是在训练幽灵。”  

更关键的是,人类会“遗忘”——正因记不住所有细节,才被迫提炼规律;而LLM记得太清楚,反而学不会抽象。人类还能创造文化:写书给后代、建知识库、代际传递智慧。但LLM连“为其他LLM写教程”都做不到,它们没有共同体意识。

第六大重点:模型崩溃——AI正在悄悄“精神内耗”

这是最隐蔽也最危险的问题:当AI开始用自己生成的内容训练自己,就会陷入“模型崩溃”(Model Collapse)。表面看,每次回答都挺正常;但多问几次,你会发现它翻来覆去就那几个套路。  

比如让ChatGPT讲笑话,它其实只有三四个“母版”,其余全是变体。单看一条没问题,但整体分布极度贫乏。卡帕西警告:“如果你持续用AI生成的数据训练AI,多样性会指数级衰减,最终整个系统陷入思维闭环。”  

他甚至类比人类:“成年人也会‘崩溃’——我们越来越重复自己,不敢说新话。但孩子不会,他们还没过拟合。而AI,从第一天起就在过拟合。”

总结来看,卡帕西并非唱衰AI,而是呼吁行业回归理性:别再堆参数、吹幻觉,要专注构建能真正理解、推理、学习的系统。AGI可期,但路径必须重构。正如他所说:“智能不是数据的副产品,而是需要被精心设计的认知架构。”