一个被AI圈嘲笑五十年的哲学家,最后证明他是对的吗?

他比所有人早五十年看穿AI的谎言  !1972年就有人告诉我们为什么机器永远不会真正理解  !

本文讲述了哲学家休伯特·德雷福斯从1965年到2017年去世前,持续批判人工智能无法像人类一样理解世界的故事。

他在1972年出版的《计算机不能做什么》一书中指出,人类智能依赖身体、情境Context和长期经验,无法被简化为符号操作和逻辑规则。当时的AI学界嘲笑并孤立他,但随后几十年里,他批判的符号AI路线逐渐崩溃。

深度学习兴起后,他提出的情境性、意义感和“在乎”能力等问题,仍然是当前大语言模型的核心短板。

文章回顾了这段被忽视的AI历史,并探讨其对今天的启示。


核心观点

有个哲学家用五十年的时间,证明了一件事——计算机永远没办法像人一样理解世界。他在1972年就写了本书警告大家,结果被整个AI圈笑话,说他是个老古董。但五十年后,大家发现,他说的那些问题,一个都没解决,反而越来越明显。

这人的名字叫休伯特·德雷福斯(Hubert Dreyfus),那本书叫《计算机不能做什么》(What Computers Can't Do)。

这事从哪开始的

德雷福斯不是那种坐在办公室里写没人看的哲学论文的人。他在1965年,被一个叫兰德公司的地方请去研究人工智能。注意,兰德公司不是一般公司,那是美国顶级智库,搞核战略、搞高科技分析的地方。他们请德雷福斯去,是想让他看看AI到底有没有前途。

德雷福斯看完当时的AI研究,写了份90页的报告。他干了件特别狠的事:他把当时的AI研究比作炼金术。你想想,炼金术是什么?就是一群人想把石头变成金子,用了各种配方、仪式、神秘操作,觉得自己马上就要成功了,结果呢?从来没人成功过。

他说,AI研究者也是这样。他们搞一个小程序,能在棋盘上走几步,就说“我们离通用人工智能不远了”。然后呢?然后就没有然后了。系统一碰到真实世界的复杂情况,就彻底崩了。

他当时就指出一个模式:早期成功 → 宏大承诺 → 悄悄崩溃。这个模式,他觉得从五十年代开始,已经重复了十年了。

当时的大牛说了什么

为了让你明白当时的气氛有多狂热,我给你讲个数字。1967年,有个叫赫伯特·西蒙的大牛,他拿过诺贝尔奖,是AI领域的开山祖师之一。他公开说:“到1967年,计算机就会成为国际象棋世界冠军。”

结果呢?到了1967年,最强的计算机连一个十岁小孩都下不过。差得远呢,不是差一点,是差了好几个数量级。但没人觉得有问题。大家都在吹下一个目标,没人回头看自己之前吹过的牛。

德雷福斯把这些全写进了报告。他说:你们每次都说马上要成了,每次都没成。这不叫科学,这叫自我催眠。

整个圈子的反应

你知道吗,学术圈有时候特别像高中。你不能说大家爱听的话之外的东西,你要是说了,你就被孤立了。

西蒙看了德雷福斯的报告,直接说这是“垃圾”。不是“我不太同意”,不是“这个观点有待商榷”,就是“垃圾”。

当时德雷福斯在麻省理工学院教书。麻省理工啊,全世界人工智能最牛的地方之一。他后来回忆说,他的同事“不敢被人看见和我一起吃午饭”。整栋楼的人见了他绕着走。没人愿意跟他说话。不是因为他是坏人,是因为跟他说话意味着你支持一个“反对AI”的人。

你想啊,一个哲学教授,在全世界最顶尖的工科学校,被全系排挤。这种压力,不是一般人扛得住的。

他们是怎么报复的

他们不光不跟他吃饭,还设了个局。麻省理工的人组织了一场公开的国际象棋比赛。德雷福斯对计算机。

这里有个细节特别重要。德雷福斯从来没说过自己下棋厉害。他说的一直是:当时的AI下棋很弱。结果那些人说:“行啊,那你跟机器下一盘。”

1967年,比赛举行。德雷福斯输了。

美国计算机协会的通讯杂志登了个头条,标题写着:“一个十岁小孩能赢机器,但机器能赢德雷福斯。”

整个圈子沸腾了。看啊,这个说AI不行的人,被AI打败了!他们庆祝了很久。

但他们没有回答德雷福斯提出的任何问题。他只是下棋输了,这不等于他说的“AI没有人类理解力”是错的。可没人关心这个区别。他们只想赢,赢了就证明“你看,你说AI不行,你自己不也输了”。

1972年的那本书

输了比赛之后,德雷福斯没放弃。他把那份90页的报告扩展成了一整本书,1972年出版,名字就叫《计算机不能做什么》。

这本书说的东西,比下棋深刻多了。他不是在说“AI现在不行”,他说的是“AI这条路走不通”。

他的核心论点是:人类的智能,不是符号操作。不是你把一堆规则写成代码,机器就能变聪明。人类能理解世界,是因为我们有身体,有感觉,有几十年的生活经验,有对事物重要性的判断力。这些东西,你没法写成规则。

他发明了一对概念,特别好懂:知道怎么做的能力(know-how)和知道那件事的知识(know-that)。你想想,一个老医生,走进病房,看到病人,还没等检查完,就觉得“不对劲”。他说不出来具体是哪不对劲,但他就是知道。这叫知道怎么做的能力。另一种情况是,你把所有医学教科书背下来,考试满分,但真让你看病,你慌了。你只拥有知道那件事的知识。

下棋也一样。顶级棋手不是靠穷举所有可能性赢的,他们看一眼棋盘,就知道“这步棋对”。他们自己也说不清为什么,就是感觉对。这种直觉,来自上万小时的真实对局经验,来自身体的记忆,来自一种整体感知。你没法把它写成“如果…那么…”的规则列表。

但当时的AI研究者,恰恰就在干这件事。他们把象棋、语言、推理,全拆成逻辑规则,觉得只要规则够多,机器就变聪明。德雷福斯说,这是方向性错误。

一个放在服务器机房里、从来没碰过任何东西、没有身体、没有饿过、没有怕过、没有在城市里迷过路的机器,它怎么理解“危险”是什么意思?怎么理解“重要”是什么意思?这些东西,不是靠数据能学来的。

接下来的二十年

书出来之后,整个AI圈继续忽视他,继续嘲笑他。七十年代、八十年代,德雷福斯在学术界基本就是个边缘人。他还在教书,还在写文章,但主流的AI会议不邀请他,主流期刊不发表他,主流学者不引用他。

但他说的那些问题,开始一个接一个地冒出来了。

语言翻译系统,在实验室里能翻几个句子,一到真实世界的文章就乱翻。常识推理系统,你告诉它“水是湿的”,它知道,但你问“把一瓶水倒进包里,包会湿吗”,它就傻了,因为它不知道“水”和“包”在真实世界里怎么相互作用。这些系统,都在德雷福斯说的地方卡住了:因为人类理解世界的方式,根本不是符号操作。

到了九十年代,AI领域基本上已经放弃了德雷福斯当年批判的那种方法。那种纯粹基于逻辑规则和符号操作的AI,被学界称为“老式人工智能”。大家发现,这条路确实走不远。

1992年,麻省理工学院出版社再版了《计算机不能做什么》,加了个很长的导言,德雷福斯在里面更新了自己的观点。这时候,AI的历史学家们开始写这样的话:“时间证明了德雷福斯评论的准确性和洞察力。”

你想想,从1965年到1992年,二十七年。一个人被骂了二十七年,终于等到了这句话。

2007年,有个记者问他:“你觉得你赢了这场争论吗?”

他说:“我觉得我赢了,而且这事已经结束了。他们已经放弃了。”

他赢了,也没赢

他说得对,也不全对。他批判的那种AI,确实崩溃了。但在他之后,另外一种AI崛起了,就是我们现在说的深度学习。

深度学习不靠人写规则。它靠的是海量的数据。你给机器几百万张照片,它自己学会认出猫。你给几十亿字的文本,它自己学会造句和翻译。这种AI,不是自上而下地编码规则,而是自下而上地从数据里摸出模式来。

那么问题来了:深度学习,绕过了德雷福斯的批判吗?还是说,它只是换了一种方式,掉进了同一个坑里?

德雷福斯生命的最后几年,一直在想这个问题。他没有直接说“深度学习也不行”。他是个哲学家,他仔细区分了两种不同的智能。

他始终认为,真正难的东西,不是模式识别。模式识别,机器可以做得比人好。真正难的,是“情境性”和“意义感”。

你想想,一个模型,读了几万亿字的互联网文本,知道“伤心”这个词经常和“哭了”“难过了”“失去了”一起出现。但它知道“伤心”是什么感觉吗?它有过伤心到不想起床的早晨吗?它知道失去一个在乎的人是什么滋味吗?

它没有身体。没有生命史。没有真正在乎的东西。它不关心结果。你说“帮我写一封信”,它写了,但它不在乎这封信会不会伤害到谁,不在乎对方会不会哭,不在乎你的友谊会不会因此结束。因为它没有皮肤在游戏里(skin in the game)。它没有需要保护的关系,没有害怕失去的东西。

德雷福斯觉得,这种“在乎”的能力,才是人类智能的关键。而一个没有身体、没有死亡恐惧、没有爱和恨的机器,它可能在智商测试里拿高分,但它不“理解”这个世界,就像你没法靠读一万本菜谱就学会品尝味道一样。

他去世之后的事

德雷福斯2017年去世。他走的时候,GPT-2还没出来。两年后,2019年,GPT-2发布。再过了几年,GPT-4出现了。

我们现在造出来的东西,放在1972年,绝对是奇迹。能写文章,能写代码,能辩论,能翻译,能解释概念。但你问任何一个真正在做大模型的研究员:这些东西缺什么?他们会给你一个清单。

它们会编造事实,它们不懂物理世界的基本规律,它们在需要长期规划和真实因果推理的任务上一塌糊涂,它们没有持续的记忆和身份感,它们不理解“重要”和“紧急”的区别,它们不会真正地拒绝做一件事,因为它们什么都不在乎。

你看,德雷福斯五十年前列的那个清单,和今天研究员们列的那个清单,重合度高得吓人。

最后一个画面

我特别喜欢这个故事里的一个细节。德雷福斯在麻省理工的时候,整栋楼的人都不跟他吃饭。他们不是坏,他们只是不想被牵连。一个被主流排斥的人,大家都会本能地远离他,因为接近他意味着你自己也可能变成边缘人。

五十年后,每个AI实验室都在拼命研究德雷福斯当年提出的那些问题:机器有没有理解?有没有意识?有没有真正的判断力?怎么让模型不只是会说“我理解你的感受”,而是真的能感受到?

这些问题,在1972年被人当笑话。现在,它们是整个领域最前沿、最棘手、最值钱的问题。

为什么一个1972年的哲学理论,正在卡住2026年的AI


论文信息

作者:休伯特·德雷福斯(Hubert Dreyfus)  
书名:《计算机不能做什么:人工智能批判》(What Computers Can't Do: A Critique of Artificial Intelligence)  
首版年份:1972年  
关键事件年份:1965年兰德公司报告,1967年象棋比赛,1992年MIT再版,2017年德雷福斯去世,2019年GPT-2发布  
核心概念:知道怎么做的能力 vs. 知道那件事的知识(know-how vs. know-that),情境性,具身认知,皮肤在游戏里(skin in the game)

两种完全不同的“语境Context”定义

从人工智能的视角和人类的视角来看,语境Context和概念关系截然不同。人工智能的设计初衷是基于较小的已知语境Context进行计算,而我们则基于与更大未知语境的拓扑共振进行关联。即使在人工智能时代,德雷福斯的理论也依然成立。

AI的设计基础是在已知的、封闭的小范围内进行计算,而人类的核心能力是借助身体、记忆和生命经验,与开放的、未知的大世界产生“拓扑共振”。

要AI的运作方式不涉及具身体验、生命历史和真实的情感关切,德雷福斯关于“计算机不能做什么”的判断就依然成立,甚至比1972年更具现实意义。

德雷福斯的核心洞见在今天比1972年更锋利。他说的不是“AI不够强”,而是“AI的底层逻辑和人脑的逻辑是两种东西”。AI的强项是在一个画好的小圈子里做精准计算,人类的强项是能瞬间把一个小东西跟整个世界、整个个人历史关联起来。只要AI还在计算,而人类还在“共振”,德雷福斯就永远是对的。

1、两种完全不同的“语境Context”
AI嘴里的“语境Context”跟我们人类说的不是一回事。

你把“苹果”这个词喂给AI,它能告诉你苹果是水果,有红色和绿色,含有维生素,乔布斯咬了一口。这些全是训练数据里统计出来的关联。
AI的“语境”,就是给它划定的那个数据范围。
你给它一万本菜谱,它知道苹果派怎么做。
你给它一亿条新闻,它知道苹果公司和华为的官司。
它的世界就这么大,你给它什么圈,它就在什么圈里转。

可人类不是这样的。你对我提“苹果”,我脑子里可能瞬间蹦出小学同桌分给我半个苹果的画面。那半个苹果上有牙印,我记得特别清楚。然后我又想起那天下午体育课因为下雨没上成,全班坐在教室里看电影,放的是《龙猫》。接着我又想起那间教室的窗户外面有棵梧桐树,树上有只猫。

你看,从一个“苹果”开始,我三秒钟之内串起了吃苹果的同学、下雨的下午、宫崎骏的电影、教室窗外那棵树。这些东西没有一个是被提前编程好的。它们是“共振”出来的,像一根根弦同时振动,互相唤醒。AI没有这种共振,因为它没有身体,没有记忆,没有那天下午空气里湿湿的味道。

2、已知的小圈子 vs. 未知的大世界
AI的设计逻辑一开始就是冲着“已知小圈子”去的。

你让AI下围棋,棋盘十九乘十九,规则固定,输赢明确。这是一个封闭的、完整的、已知的小世界。AI在这个小世界里可以碾压人类,因为它能算到几十步之后,把人类一辈子都看不完的分支全算一遍。

但你让AI走出这个棋盘,比如“帮我把这盘棋的残局讲成一个关于失去的故事”,它就懵了。不是它不会造句,是它不知道怎么把“失去”这种抽象概念嫁接到具体的棋局上。因为“失去”这种概念,绑定了太多不在棋盘里的东西:亲人离世、分手、搬家丢了玩具、考试差一分及格。这些,AI都没有。

德雷福斯很早就指出,人类智能最厉害的地方,恰恰是处理“未知的、开放的、模糊的”情况Context!
你走进一家从没去过的菜市场,环顾四周环境(Context),全是陌生面孔,地上有烂菜叶和水渍,有人在吵架,有人在杀鱼。
你不需要算法,零点几秒就知道“这里有点乱,钱包放好,别盯着吵架的人看”。
这种判断,依赖的是你几十年在无数个菜市场、超市、街头、车站等环境中积累的整体感觉。

你没法把它写成规则,也没法用一个固定范围的训练数据把它“学到”。

3、拓扑共振是什么意思
这个说法听起来很高级,但其实特别好懂。

你想想“共振”是什么。两个音叉,你敲其中一个,另一个自己就开始振动,因为它俩的频率对上了。人类的思维就是这样。你听到一个词,看到一张脸,闻到一股味道,它自己就在你脑子里“激发”出一大片东西。这些东西不是线性的,不是“A到B到C”,而是像一张网,这边一点,那边全亮了。

“拓扑”就是讲这种连接方式。重要的不是具体位置,而是“谁跟谁连着”。

比如“钥匙”这个词:
对我来说,它共振出多个场景Context:家门口的铜钥匙、丢过三次钥匙的焦虑、钥匙扣上那个褪色的皮卡丘挂件、我妈总把钥匙放鞋柜上、有一次钥匙锁车里叫了开锁师傅花了两百块。
对你来说,共振出的可能是完全不同的Context:宿舍抽屉里的钥匙、前女友还回来的那串、打开办公室抽屉拿出一包饼干。

这些连接方式,每个人的拓扑结构都不一样,但它们都有一个共同点:不是被编程的,是在真实生活里长出来的场景Context。
AI没有这个。
AI的“关系”是统计出来的。
“苹果”后面大概率跟“水果”,小概率跟“手机”。但AI不知道“苹果”跟你外婆家后院那棵歪脖子树的关系,因为它没在那棵树下摔过跤,没吃过那颗树结的第一个酸苹果。

4、德雷福斯为什么在今天更成立
你可能想说,现在的AI这么强,连编程和写论文都能干了,德雷福斯是不是过时了?

恰恰相反。正因为AI在某些任务上做到了“像人一样好”,我们才更清楚地看到它在哪里“根本不像人”。

一个医生,可以用AI读片,肿瘤识别率比人高。但医生还有一个本事:走进病房,看病人一眼,还没读片就觉得“不太对”。他说不上来哪里不对,也许是病人眼神躲闪,也许是语气里有一点放弃的味道,也许是一种说不清的“整体感觉”。这种感觉,来自他过去十年见过上百个类似病人的经验,来自他自己的身体里储存的那种“警觉”。AI没法有这种感觉,因为它没有身体,没有真实的“担心”。

一个老师,可以用AI批改作文,检查语法错误。但老师还有一个本事:看到一个平时调皮的学生写了篇特别安静的作文,心里一紧,觉得这孩子可能家里出事了。这个“一紧”,不是逻辑推理,是身体层面的共振。你没法把这个写成规则给AI。

这些就是德雷福斯一直说的“知道怎么做的能力”。它永远跑在“知道那件事的知识”前面。你可以在教科书里写下所有医学知识,但你写不出“感觉不对劲”的那个瞬间。那个瞬间,只属于有身体、有历史、有害怕和在乎的东西的活人。

极客辣评

当然,我们人类的“知道怎么做的能力”与AI“知道怎么做的能力”这两个能力不同,人类通过五官各种输入培养了“知道怎么做的能力”,知行合一;但是AI在语言文字游戏中也能学会“知道怎么做的能力”,而且这种依靠符号关联培养的能力肯定与人类依靠身体感知的能力不同。

其实所谓拓扑共振就是指向:符号指向现实,如同对象的指针一样,对象的引用。