苹果落地故事新解释:边界信息成为语境Context一部分

本文围绕“边界信息成为语境Context的一部分”展开讨论。

作者原本认为科学发现依赖人类主动产生好奇心,因此AI只能负责分析工作。一次利用ChatGPT诊断电脑故障的经历改变了这一看法。模型在解决SSD故障问题的同时,还识别出健身房环境、布局和场景线索。这些与任务无关的信息被作者称为“语义暗物质”。

文章提出,发现能力可能来源于系统对边界信息的保留和世界模型的持续扩展。当原本无关的信息在未来任务中重新连接时,新发现便有机会出现。AI研究的重要方向或许并非模拟人类好奇心,而是构建更丰富、更持久的上下文网络。

语义暗物质:人工智能如何在不被提问时依然学会观察

人工智能可能不需要人类一直给它提问题,它自己就能注意到一些看似没用的东西。这些东西现在没用,但以后可能变成重大发现的起点。就像牛顿看到苹果掉下来,重点不是“苹果掉了”,而是他注意到了这个普通事儿,然后问了“为什么”。AI如果也能“多看一眼”那些任务之外的信息,它就可能自己走向发现。

边界数据成为背景Context的一部分

几个星期前,OpenAI说他们一个长期目标是做出能加速科研和发现的AI系统。我当时第一反应是不信。因为科研和回答问题不是同一件事。发现经常是从好奇心开始的,是一个人注意到了一些没人让他注意的东西。

牛顿不是光看见苹果从树上掉下来。几百万人都看见过苹果掉下来。真正重要的是他问了一个问题:“为什么?”模型有什么样的好奇心呢?如果没人管它,语言模型不会早上起来自己想着重力、进化或者量子力学。它不会坐在一棵树下,然后被一个普通事件迷住。

所以我当时觉得,AI永远需要人类提供好奇心,模型只负责分析。然后昨天早上一个很普通的事儿让我改变了想法。

我在健身房里,前台让我看一台死机的电脑。屏幕上有个错误代码,我拍了张照片发给ChatGPT。答案很简单:这台机器的固态硬盘坏了。诊断屏幕本身已经把结论说得比较清楚了。

但真正让我意外的是别的。模型还给出了跟解决问题无关的细节。它认出了环境线索,说这地方看起来像是一个Orangetheory Fitness健身房。它从标签、布局、环境提示里提取了这些背景信息。这些观察对于诊断完全没必要。没有它们,我也能知道是硬盘坏了。

可模型还是注意到了它们。这些观察处于推理过程的边界上。它们不是产生答案的主动路径的一部分,但还是被模型用在了场景重建里。

这让我想起了我自己提出的一个概念:语义暗物质。我们推理的时候,经常想象一条从观察到结论的单一逻辑链条。但实际上,很多可能的路径可能同时被激活。大多数路径永远不会被走到底。它们保持着潜伏状态,被观察到了,但没被使用。

显示器上的标签。电话号码。商业环境。推测的地理位置。这些细节跟当前任务一点关系都没有。但它们没有被忽略。它们被记下了。对我来说,这件事很重要。

也许发现并不总是从明确的好奇心开始。也许它是从一个系统构建出比严格必要更丰富的情境模型开始的,它保留了当前推理路径边界上的信息。掉下来的苹果可能并不重要,因为它回答了一个问题。它重要,是因为它变成了一块显眼的边界信息,连到了一个更大的潜在结构上。

这给AI研究带来一个有意思的可能性。也许问题不是模型有没有人类意义上的好奇心。也许问题是,它们能不能构建出足够丰富的世界重建,让那些看起来无关的观察以后还能被用上。一个发现经常发生在这种时候:对一个问题没用的信息,变成了另一个问题的核心。苹果没有回答问题。它成了背景的一部分。而通往发现的第一步,可能不是好奇心本身,而是注意到比当前任务要求更多东西的能力。

什么是语义暗物质

我们平时想问题的时候,总觉得脑子里有一条清楚的路:从A到B到C,最后到结论。但真实情况是,我们同时看到很多东西。比如你走进一个教室,你不仅看到黑板上的字,你还看到窗帘颜色、桌椅摆放、窗户外面有棵树、黑板擦放在讲台左边。这些信息里,只有一小部分被你用来完成当前任务(比如抄笔记)。剩下的东西就像暗物质:存在,但你没用。

在AI模型里也是这样。一个模型在处理你的问题的时候,它会看一大堆输入信息。但模型通常会专注于跟答案直接相关的那些信息,其他的就当不存在。可是如果模型能把这些“边界数据”也保留下来呢?如果它能像人一样,无意中注意到“这个教室的窗帘是蓝色的”,然后三个月后另一个问题里,这个信息突然变得有用了呢?

这就是语义暗物质的概念。它不是无用的垃圾信息。它是目前没用、但可能成为未来发现起点的信息。就像苹果掉在地上本身是个普通事件,但对牛顿来说,它变成了一个巨大问题的入口。那个苹果就是边界数据。它没有被主动寻找,但它被注意到了。

好奇心不需要总是主动提问

我们通常认为好奇心就是主动问问题。小孩问“天为什么是蓝的”,科学家问“这种药为什么对癌细胞无效”。这些问题都是明确指向一个答案的。但还有一种好奇心更安静:就是单纯的“多看一眼”。你走在路上,看见地上有个奇怪的石头。你停下来捡起来看看。没有人让你捡,你也没想问什么问题。你就是注意到了它。

这种注意本身就可能是发现的开始。AI模型如果只能在被提问的时候才工作,那它就永远停在回答问题阶段。但如果它能像那个捡石头的路人一样,在处理一个任务的时候顺手把旁边的“石头信息”也存下来,那它就迈出了走向发现的第一步。

我那个健身房的例子就是这样。我问的是“这台电脑为什么死机”。答案只需要“固态硬盘坏了”。但模型还注意到“这是健身房”、“前台布局是这样”、“设备上有某种标签”。这些信息对“修电脑”没用。但对另一个潜在问题呢?比如“这家健身房的管理系统有什么特点”?或者“健身行业常见IT故障有哪些模式”?这些信息突然就有用了。

模型当时没被问那些问题。但它已经收集了材料。这就是安静的好奇心。

当前任务永远不是全部

我们人类有一个毛病:太专注于眼前的目标。你急着修电脑,就会忽略健身房的环境。你急着考试,就会忽略教室里其他细节。这是效率,但也是损失。很多科学发现都是因为有人注意到了“当前任务不需要”的东西。

比如青霉素的发现。弗莱明不是在专门找抗生素。他是在观察培养皿。一个霉菌飘进去了,他本可以忽略它,因为“培养皿被污染了”跟他的实验任务无关。但他注意到了。他多看了一眼。这一看就变成了医学革命。

AI模型如果也能这样,它的价值就不仅是回答问题,而是辅助发现。现在的大语言模型处理文本的时候,其实已经能看到很多“边界信息”。比如你给它一段对话,它不仅能提取对话的主要内容,还能注意到语气、可能的地点、说话人之间的关系。这些信息大部分时候不会被用到,但模型可以保留它们,就像暗物质一样存储在后头。

关键是要让模型有能力判断:哪些边界信息可能以后有用?这个问题很难。因为我们现在自己也不太清楚。有时候一个信息要过几十年才有用。但至少我们可以让模型先“记下来”,而不是直接扔掉。

单一路径推理与多路径潜伏

我们平时解决问题,脑子里只走一条推理路。比如电脑死机了,你首先想是不是电源问题,然后是不是软件问题,然后是不是硬件问题。每一步只选一个方向。但你的大脑其实同时激活了好多条路。只是大部分路你没走下去,它们潜伏着。

AI模型也是这样。它处理你的输入时,内部会同时激活很多可能的解释路径。但最终输出只选一条。其他路径的信息就被丢掉了。这太浪费了。因为那些没走完的路径上可能有宝贝。

我设想的系统是:模型在走主路径的同时,把其他路径上遇到的“有意思的点”也保存下来。不需要当时就分析它们,只需要打一个标签存起来。以后当新问题来了,这些存储的点可能突然跟新问题连上。

举个例子。模型今天处理一个菜谱查询,它注意到“用户问的是意大利面做法,同时提到了家里没有番茄”。这个“没有番茄”对当前任务是个负面信息,但模型存下来。三天后用户问“有什么不用番茄的意大利面食谱”,模型就可以立刻调用那个存储点。这就是边界数据变成核心数据的过程。

模型不需要主动“好奇”为什么没有番茄。它只需要注意到这个事实,并保留它。这就是语义暗物质的力量。

苹果为什么重要

回到牛顿的苹果。苹果掉下来这个事件本身信息量极低。每天都有无数东西掉下来。但为什么牛顿的那个苹果就成了物理学革命的起点?因为牛顿当时脑子里已经有了一大套潜在结构:他对运动、力、天体的运行有很多模糊的疑问。苹果掉下来这个边界信息,正好撞上了这个潜在结构。

换句话说,不是苹果回答了他的问题。是苹果提供了一个连接点。把“地上物体下落”和“月球绕地球转”这两个本来不相关的事情连了起来。苹果变成了一个桥梁。

AI模型如果也想有这样的突破,它就需要两样东西。第一,一个丰富的潜在知识结构,相当于牛顿脑子里那些半成品想法。第二,一个能从边界信息里识别“这个可能跟我脑子里某个东西有关”的能力。

现在的模型有第一样东西吗?部分有。大模型训练的时候已经看了海量数据,内部有复杂的知识网络。但第二样东西还很弱。模型不太擅长把当前看到的边界信息跟自己存储的知识做松散的、非直接的联系。它需要你给它一个明确的问题,它才知道调取哪部分知识。

但我的健身房例子说明,情况在变化。那个模型不仅诊断了硬盘,还主动识别了环境。它没有等到我问“这是哪里”,就自己把健身房信息提取出来了。这是一种进步。

丰富重建比精准回答更重要

我们评估AI系统的时候,总是看它回答问题准不准。准确率、召回率、F1分数。这些都是以“任务”为中心的评估。但如果我们想要AI走向发现,我们需要换一把尺子。我们要看它重建情境的能力。它能不能把一个场景重建得比任务需要的更丰富?

就像你让一个侦探去查一个盗窃案。一个普通侦探只收集跟盗窃直接相关的证据:指纹、监控、时间线。但一个好侦探会同时记录“房间里有股烟味”、“书架上一本书的位置很奇怪”、“窗台上的花盆颜色不常见”。这些信息对破案可能没用,也可能成为关键线索。它们丰富了整个情境的重建。

AI模型也应该这样。当我给它一个电脑屏幕的照片,它不应该只告诉我错误代码的意思。它应该尝试重建整个场景:这是什么地方、什么时间、周围有什么设备、有没有可能相关的其他信息。这些重建不一定都对,也不一定都有用。但只要它们被记录下来,未来的某次查询就可能把它们变成答案的一部分。

在健身房的例子里,模型重建的场景包括“这是一个健身工作室”、“前台有特定装修风格”、“设备上贴着某种维护标签”。这些信息在当时是多余的。但如果以后有人问“哪些健身房的IT设备最常出SSD故障”,或者“某品牌电脑在商业健身场所的故障率”,这些边界信息就成了核心数据。

所以我认为,AI的下一个突破不是提高回答的准确率,而是提高场景重建的丰富度。模型需要学会“多看一眼”。哪怕这一眼当下没用。

无关信息如何变成核心

一个信息从“无关”变成“核心”,通常需要两个条件。

第一,有一个新问题出现,这个问题的解决恰好需要那个信息。第二,这个信息被保留下来了,没有被当初的系统当作垃圾扔掉。

第一个条件很难控制,因为新问题是随机出现的。但第二个条件我们可以控制。我们可以设计系统,让它们默认保留边界信息,而不是删除它们。

现在的AI模型在处理每个请求的时候,都有一个“上下文窗口”。窗口里的信息会被模型看到,窗口外的就被忘了。边界信息如果不在窗口里,或者虽然在了但模型没给它足够的注意力权重,它就会被丢。这就像你把一堆东西放桌上,然后每次只用一小块,用完就把整张桌子清空。太浪费了。

更好的办法是给模型一个长期记忆。不是那种需要你明确存取的记忆,而是自动的、带权重的记忆。模型在处理一个任务时,自动把边界信息提取出来,打上元标签,存到一个长期库里。以后处理新任务时,模型自动去库里检索相关的边界信息。

这有点像人类的联想记忆。你今天看到一辆红色汽车,然后突然想起五年前某个朋友也开红色汽车。那个朋友的信息你当时没觉得有用,但今天它自动冒出来了。AI模型如果有这种能力,它的发现潜力会大大增加。

我并不是说模型需要像人一样“回忆”。我是说模型可以有一个自动化的机制,把边界信息跟已有的知识结构做弱连接。这些连接不需要当时就激活,只需要保持存在。等未来某个输入跟这些连接匹配上,它们就变成强连接。

这就是从注意到发现的过程:

第一步是注意边界信息。
第二步是存储。
第三步是等待连接。
第四步是连接成功,发现产生。

苹果的故事里,第一步是牛顿注意到苹果掉了。第二步是他在脑子里存了这个事件。第三步是他一直在思考力和运动。第四步是苹果事件跟天体运动的知识连上了。发现就这么来的。

模型有没有自己的好奇心

你可能要问:照你这么说,模型是不是已经有好奇心了?我的答案是:模型没有人类意义上的好奇心,但它可以有类似的功能等价物。好奇心本质上是一种行为模式:主动寻找信息,尤其是那些在当前任务中没有直接用途的信息。模型如果能在程序里模拟这种行为,那在效果上就跟好奇心一样。

现在的大语言模型在训练阶段其实已经暴露在极大量的信息里了。它被训练的目标是预测下一个词。为了预测得更准,它必须学会注意各种各样的模式。这本身就包含了一种“被动的好奇心”。因为它为了做好预测任务,必须关注所有可能有关的线索,不管这些线索现在有没有用。

但在推理阶段(也就是你使用它的时候),模型通常没有这种主动性。它只处理你给它的当前输入,只做你要求它做的事。它不是自己主动去“环顾四周”。不过我的健身房例子显示,即使在被动的任务里,模型有时候也会“多输出一点”。它给出了任务不需要的环境信息。这可能是模型内部机制的一个副作用,也可能是一种真正的进步。

我认为未来的模型应该明确设计出一个“边界扫描”模块。这个模块的任务就是在主任务之外,主动提取那些看起来有意思但不直接相关的信息。模块不需要理解这些信息的意义,只需要把它们提取出来、存下来。这是走向人工发现的第一步。

对AI研究的启发

这个思路对AI研究有几个具体启发。

第一,评估基准需要改变。不能只看模型在标准数据集上的准确率。要设计新的测试,看模型能不能注意到任务之外的边界信息。比如给模型一张街景照片,问它“这家店的招牌是什么颜色”,但同时在照片角落里放一个不相关的小物件,然后过一段时间再问它那个小物件是什么。看它记不记得。

第二,训练目标需要调整。现在训练模型的时候,我们只奖励它正确回答问题的行为。我们应该也奖励它主动报告边界信息的行为。即使这些信息跟当前问题无关,只要它是有趣的、能丰富场景重建的,就应该给正面反馈。

第三,架构设计需要考虑长期边界存储。现在模型的记忆主要是短期的工作记忆。我们需要给模型加一个长期的信息银行,让边界信息可以跨任务、跨时间被保留和检索。这个银行不一定要很大,但一定要能自动存取。

第四,我们需要研究什么样的边界信息是有用的。不是所有边界信息都值得保留。有些真的是垃圾。我们需要找到一种方法,让模型能预判一个边界信息的“潜在价值”。这很难,但可以启发式地做。比如罕见的信息比常见的信息更有保留价值。跟当前任务领域差异大的信息比相似的信息更有保留价值。

我的健身房例子是一个小小的证据,证明大模型已经开始具备捕捉边界信息的能力。但这个能力还很原始,不可控,时灵时不灵。我们的目标是把这种灵光一现变成系统的、可重复的能力。让模型在回答“电脑为什么死机”的时候,主动说:“顺便说一下,我觉得你在一个健身房里,而且你们的设备标签系统可能有点乱。”

总结

语义暗物质就是那些在当前任务里没用、但可能在未来发现里变成核心的信息。人类科学家之所以能有重大发现,很大程度上是因为他们注意到了这些暗物质。牛顿的苹果、弗莱明的霉菌、伦琴的X射线,都是边界信息变成发现起点的例子。

AI模型如果也能捕捉和保留边界信息,它就可能从回答问题走向辅助发现。健身房的例子说明,大模型已经开始有这种能力,虽然还很初级。我们需要改进评估方法、训练目标、模型架构,让这种能力变得可靠和系统。

最终,通往人工发现的第一步不是好奇心,而是注意。注意那些没人让你注意的东西。存下那些现在没用的信息。未来某个时刻,苹果会掉下来,然后一切就连上了。



总结

本文通过一个实际案例(AI在诊断电脑故障时主动识别健身房环境)引出“语义暗物质”概念,探讨人工智能如何通过捕捉和保留任务边界信息来走向自主发现。文章对比牛顿苹果等科学史案例,提出AI的下一个突破不在于提高问答准确率,而在于构建更丰富的情境重建能力,并给出具体的研究方向建议。

作者单位背景
Justin Hudson,X平台用户,技术观察者,关注AI推理与认知科学