游戏规则改变者:Demis Hassabis 重新定义AGI发展时间线与路径


在Fry's AI播客中,Demis Hassabis清晰阐述了通往AGI的路线图,被视为年度最明确的规划。他系统性拆解了发展步骤与核心挑战,为混乱的AI讨论提供了权威的行业基准。

从神童棋手到AGI掌舵人
德米斯·哈萨比斯(Demis Hassabis)是谁?他是DeepMind联合创始人兼CEO,谷歌旗下最神秘又最硬核的AI实验室掌舵人。13岁成为国际象棋大师,20岁从剑桥大学计算机科学系毕业,之后创立游戏公司、攻读认知神经科学博士,最终在2010年创办DeepMind——目标只有一个:构建人工通用智能(AGI)。

2014年被谷歌以5亿美元收购后,他带领团队接连推出AlphaGo、AlphaFold、Gemini等里程碑式成果,堪称AI界的“现实版钢铁侠”。他不仅是技术极客,更是哲学思考者,长期关注意识、创造力与人类独特性的边界。

在最新一期谷歌DeepMind播客中,他与主持人汉娜·弗莱(Hannah Fry)展开长达万字的深度对话,首次系统阐述了他对AGI路径、社会冲击与人类未来的全景预判。


AGI不会只靠堆数据,而是规模与创新各占一半  
通用人工智能(AGI)的实现并非仅靠规模化就能完成。德米斯·哈萨比斯认为,规模化和创新各占50%。更大的模型固然重要,但新思路同样至关重要。

很多人以为人工通用智能(AGI)就是把模型做得更大、数据喂得更多,但DeepMind联合创始人兼CEO德米斯·哈萨比斯(Demis Hassabis)直言:“我们的努力50%在规模化,50%在创新。要抵达AGI,两者缺一不可。”

他承认过去一年Gemini系列模型能力突飞猛进,但强调真正的突破来自底层科研——比如世界模型、推理机制、在线学习架构。

他指出,当技术进入深水区,“仅靠工程已远远不够,必须回归世界级科学”。
这正是DeepMind的护城河:既有谷歌TPU等顶级基础设施,也有横跨神经科学、物理学、数学的顶尖研究团队,能同时驾驭规模化与基础创新。  

今天的AI强大却“锯齿状”:能拿奥数金牌,也会算错小学题  
当今的人工智能功能强大,但并不完善。它在数学奥林匹克竞赛中达到了金牌水平,却仍然无法通过基本的逻辑和一致性测试。正是这种差距导致我们尚未实现通用人工智能(AGI)

当前AI最令人困惑的悖论是:它能在国际数学奥林匹克竞赛中斩获金牌,却在高一逻辑题上频频翻车。
哈萨比斯称之为“锯齿状智能”(jagged intelligences)——某些维度达到博士水平,某些维度连中学生都不如。

这种不一致性,正是AGI尚未到来的核心标志。

他解释,问题可能出在输入表征(如图像转文本丢失细节)、推理时间未有效利用、或缺乏工具调用验证机制。
真正的通用智能必须稳定可靠,而非只在特定任务上“超神”。(这里有定义分歧:成为专家是不是AGI?Claude Opus 4.5在Claude Code中基本就是AGI )

哈萨比斯坦言:“我们可能只走了50%的路。”  

缺的不是算力,是可靠性、推理与对“不确定”的自知  
缺失的要素不是智能,而是可靠性、推理能力和对不确定性的自我意识。人工智能需要知道自己不知道什么。

哈萨比斯指出,AI真正的短板不是知识量,而是“知道什么不知道”。

他说:“现在的模型总在被迫回答,哪怕它其实没把握。”这导致大量幻觉(hallucinations)——并非模型在撒谎,而是它被训练成“必须输出”。

对比AlphaFold的成功,关键在于它输出每个氨基酸置信度分数,用户一眼可知哪些结构可靠。
Gemini正尝试类似机制,通过“推理链”回溯验证自身输出,但尚未成熟。

“理想状态是模型能像人一样:停顿一下,自问‘这话靠谱吗?’再开口。”  

幻觉本质是被迫输出:好模型应学会说“我不确定”  
幻觉并非随机出现。它们通常是因为模特被迫回答问题,而他们本应该说“我没有信心”。

哈萨比斯对“幻觉”有颠覆性解读:“有些幻觉其实是创造力的副产品——关键是如何按需开关。”
他承认当前系统常在不该回答时强行作答,但解决方向不是消除幻觉,而是赋予模型“拒绝回答”的能力。

这需要训练模型在推理过程中主动调用计算器、代码解释器等工具,形成“思考-验证-修正”闭环。
他比喻道:“现在的AI像话痨朋友,想到啥说啥;AGI应像严谨科学家,先审视证据再下结论。”  

AlphaFold证明:解决一个“根问题”,能撬动整个产业  
AlphaFold 展示了成功之道:一次性解决根本问题,就能带动下游整个产业的发展。现在,DeepMind 的目标是材料、核聚变和气候。

DeepMind的AGI路径并非只做通用模型,而是“根问题优先”。

AlphaFold就是典范:它不直接造药,但通过精准预测蛋白质结构,为药物研发、酶工程、罕见病治疗打开大门。哈萨比斯透露,团队正将此模式复制到材料科学(如室温超导体、高能电池)、聚变能源(与Commonwealth Fusion合作控制等离子体)、量子纠错(与谷歌量子AI团队协作)等领域。

他说:“这些是‘根节点’——一旦突破,下游产业将指数级受益。”  

聚变能源是终极根节点:廉价清洁能源将重塑一切  
聚变是最终的根本节点。清洁、丰富的能源将重塑水资源、食物、气候,甚至太空旅行。人工智能或许能帮助我们攻克这一难题。

在所有根问题中,哈萨比斯最看重可控核聚变:“若实现模块化聚变反应堆,近乎无限的清洁廉价能源将彻底改变世界。”
这不仅直接缓解气候危机,还将解锁海水淡化(解决全球水荒)、电解制氢(打造绿色燃料)、甚至太空推进(从海水中提取火箭燃料)。
他说:“能源若近乎免费,许多当前‘不经济’的方案将变得可行——这才是真正的后稀缺社会起点。”  

语言模型令人惊喜:它比我们想象的更懂世界  

哈萨比斯承认,语言模型的能力超出预期:“语言比我们想象的更丰富,包含大量关于世界的隐性知识。”
大模型通过压缩人类文本,竟能推断出物体属性、社会关系甚至简单因果。但这仍有硬伤——“语言很难描述空间动态、触觉反馈、力学交互。
你无法用文字精确表达方向盘回正时的力反馈,或雨滴在挡风玻璃的流动轨迹。”

因此,仅靠语言无法支撑具身智能(embodied intelligence)。  

世界模型才是关键:AI需“体验”物理,而非只“阅读”描述  
语言模型让我们感到惊讶。它们对世界的理解比预期的要多。但单凭语言本身是不够的。

这就是DeepMind押注“世界模型”(world models)的原因。

哈萨比斯说:“真正的智能需理解世界因果机制——直觉物理(intuitive physics)、物体持久性、作用力与反作用力。”团队推出的Genie和VO等视频生成模型,能逼真模拟小球滚落、液体飞溅、光影反射,证明其内部已封装物理直觉。他强调:“若AI能生成逼真世界,说明它已理解其底层规则——这正是语言模型做不到的。”  

仿真即理解:能生成世界,就代表已掌握其机制  
这就是世界模型的重要性所在。为了理解物理学、空间、因果关系和行为,人工智能必须体验世界,而不仅仅是阅读相关资料。

哈萨比斯提出一个哲学命题:“如果你能完美模拟某物,你就理解了它。”视频生成模型正是这一理念的试验场。他举例:Genie生成的液体流动看似合理,但经物理引擎验证,其牛顿力学仍不够精确。

团队正构建“物理基准测试”——用游戏引擎生成斜面滚球、双摆运动等经典实验,检验模型是否真正掌握定律,而非仅靠视觉拟合。他说:“仿真世界将成为AI的‘物理实验室’。”  

让智能体在仿真中自主进化:AI版“无限训练场”  
模拟是下一个前沿领域。如果人工智能能够生成一个逼真的世界,它很可能已经理解了世界的运行机制。

更震撼的是,DeepMind将智能体(agents)投入AI实时生成的仿真世界。哈萨比斯描述道:“我们把Simma 2(模拟智能体系统)和Genie(世界生成器)对接——Simma以为自己在探索真实游戏,而Genie以为Simma只是普通玩家。两个AI在彼此的‘心智’中互动。”

这种架构能自动生成无限任务:智能体越想探索,世界越复杂;世界越复杂,智能体越需进化。他说:“这可能是通往人类式学习的关键——先探索,再理解,最后泛化。”  

从好奇驱动到科学发现:AI或重演人类认知进化  
将智能体放入这些世界中,让好奇心驱动探索学习。现在,您就拥有了无限的、即时生成的训练数据。

哈萨比斯相信,这种“好奇驱动”的仿真训练,或能复现人类认知演化。他回忆圣达菲研究所的实验:在网格世界中,智能体自发发明了市场、银行、信用体系。“只要设定合适激励,社会结构会涌现。”

未来,这类仿真可研究“意识起源”“生命涌现”等根本问题——“你能运行百万次对照实验,微调初始条件,这在现实世界根本不可能。”  

这可能是人工智能像人类一样学习的方式do. :先探索,再理解,最后概括。最被忽略超能力:“探索”决定了AI和人类智商上限

仿真也是科学引擎:从天气到生命起源  
哈萨比斯认为,模拟或许也能解开科学之谜,例如天气、生物学、材料,甚至生命的起源。

哈萨比斯强调,仿真不仅用于训练AI,更是科学发现工具。团队正用世界模型构建天气系统、生物通路、材料原子结构的动态模拟。“从原始数据学习复杂系统动力学,比暴力计算更高效。”他预言:“专用世界模型将加速材料、气候、生物医学突破——甚至帮我们理解生命如何从化学汤中诞生。”  


哲学基石:能模拟即代表理解  
为什么模拟在哲学上很重要:如果你能模拟某件事,你就理解了它。

这一思路背后是哈萨比斯的哲学信念:“宇宙本质是信息,物质与能量只是其表现形式。”生物学、物理学、意识,皆可视为信息处理系统。

因此,“若能用经典计算机模拟某现象,就证明它可被计算——也就没有神秘不可解之物。”仿真世界正是验证该信念的终极试验场。  

宇宙中是否存在“不可计算”之物?  
这就引出了一个最深刻的问题:宇宙中是否存在不可计算的事物?

到目前为止,我们还没有找到。蛋白质折叠。开始。复杂的生物学。一切皆可计算。

这引向图灵机的根本问题:宇宙是否存在非计算性(non-computable)现象?哈萨比斯的回答是:“至今未发现。蛋白质折叠、围棋、复杂生物系统——全被我们用经典计算攻克。”

他承认量子效应或有例外(如罗杰·彭罗斯认为意识依赖量子过程),但坚持:“除非物理证明否则,我默认一切皆可计算。”  

AGI将成为人类心智的镜子  
意识或许是下一个目标。通用人工智能(AGI)可能成为一面镜子,向我们展示人类思维的独特之处(如果有的话)。

哈萨比斯的终极愿景是:“用AGI模拟人类心智,再与真实大脑对比——差异处就是‘人性特有成分’。”可能是创造力,可能是情感,也可能是梦境。他说:“这将终结千年哲学争论——人性是否有不可复制的核心?”  

若创造力可计算,机器也能做梦  
如果创造力、情感或梦境是可以计算的,那么机器也可能拥有它们。如果不是,我们最终会知道它们的边界在哪里。

他进一步推演:若实验证明创造力、情感、梦境皆可被算法复现,“那机器也可能拥有它们”。反之,“若AGI始终无法模拟某特质,我们才算真正定位了人类独特性”。无论哪种结果,AGI都将成为理解“何以为人”的最强大工具。  

AGI不仅是技术革命,更是文明重构  
通用人工智能不仅仅是一个技术问题,它还是一个经济、社会和哲学问题。

哈萨比斯警告,AGI冲击将“比工业革命剧烈10倍,速度也快10倍”——可能在10年内而非100年完成。当AI接管绝大多数劳动,现有“以工换酬”经济体系将崩塌。他推动团队研究“后稀缺社会”新范式:“通用基本收入(UBI)只是起点,或许还需新型民主机制。”但他更忧心哲学危机:“若工作不再是生活核心,人类如何寻找新意义?目的感(purpose)可能比面包更稀缺。”  

工业革命耗时百年,AGI或只需十年  

哈萨比斯研究工业革命史后警醒:“当时社会用整整一个世纪适应纺织机、蒸汽机。而AGI可能十年内颠覆一切——从就业到教育,从能源到地缘政治。”他呼吁经济学家、社会学家、哲学家提前介入:“我们不能等到洪水来了才造船。”  

哈萨比斯的宇宙观:信息是万物本源,智能是终极透镜  
哈萨比斯的核心信念:宇宙的运行依赖于信息。而智慧或许是理解宇宙的终极途径。

贯穿所有思考的,是哈萨比斯的底层信念:“宇宙由信息构成,智能是理解它的终极方式。”从AlphaFold破解蛋白质,到仿真世界探索物理,再到用AGI映照人类心智——所有努力都指向同一目标:用计算揭示宇宙秩序。



极客一语道破
AGI是不是包含具身智能性?AGI是特定领域专家这还不够吗?成为通用上帝是不是过于拔高?
具身智能性是更靠近人的特定领域专家而已,百年内能做出复制人类智能的AGI吗?这些不可能性几乎没有人出来定义,一个没有定义天花板的繁荣是不是最大泡沫?