屁股决定脑袋:上下文场决定了你的感受


最近,科学家们最近在研究一个超级酷的东西:他们想让人工智能(AI)变得更像人类的大脑,不只是会算数学题的那种“冷冰冰”的聪明,而是能像你我一样“想东想西”、做白日梦、甚至还能“脑洞大开”地推理!这事儿听起来是不是有点像科幻电影?但它真在发生!

科学家发现,咱们的大脑里有一群特别厉害的“神经元”细胞,住在“新皮层第五层”(听起来是不是像大脑里的VIP包厢?)。这些细胞叫“锥体两点神经元”(简称TPN),它们超级会“变脸”!比如,你从清醒状态(刷手机、吃零食的时候)切换到慢波睡眠(呼呼大睡),再到做梦的快速眼动睡眠(REM,梦见自己变成超级英雄那种),这些TPN细胞就会跟着你的状态“切换模式”,像个超级配合的DJ,随时调整节奏,帮你的大脑跟上你的“心情”。

这些TPN细胞特别牛,它们能同时处理两种信息:

  • 一种是外面的世界传来的信号,比如你看到的风景、听到的音乐(科学家管这叫“感受场”,简称RF1);
  • 另一种是你心里的小秘密,比如你饿了、困了,或者在想啥(这叫“上下文场contextual field”,简称CF2)。

这两种信息就像在神经元里开了个“双人舞会”,一个在“基底部位”跳舞,一个在“顶端部位”耍酷,互不干扰又配合得天衣无缝。

现在,AI界的“大明星”——像Transformer、Perceiver、Flamingo这些模型,都是受到人类大脑的启发设计的。它们已经很聪明了,能翻译语言、认图片,但它们有个小问题:还不会像人一样“天马行空”地想象,也不会像你做作业时那样,先抓住重点再慢慢推理

简单说,它们还不够“有灵魂”。

这时候,斯特林大学的Ahsan Adeel教授跳出来了!他最近写了一篇论文,发表在arXiv上(这地方就像科学家的“朋友圈”,专门分享新发现)。

  • 他搞了个叫“Co4”的新模型,号称能模仿人类大脑里那些“会变脸”的TPN细胞。
  • 这个Co4模型超级聪明,它能提前“挑出”最重要的信息,就像你做阅读理解时,先把关键句子画出来,再慢慢分析。
  • 它还会模仿人类大脑的“推理三件套”:问题(你在问啥)、线索(能帮你回答的提示)、假设(可能的答案)。这三者就像大脑里的“三人小分队”,一起合作,快速从一堆乱七八糟的信息里找出重点。

Adeel教授说,这个新模型不仅学得快(比以前的AI快好多倍!),还特别“省电”,需要的计算量少得像从开大货车换成了骑自行车!他还用这个模型试了试各种任务,比如玩赛车游戏(AI得看清赛道、躲障碍)、认图片、回答问题,结果都表现得超级棒!

这说明啥?说明这个新模型离“人类级别的聪明”又近了一步!

网友热评:
1、他们搞了个新点子:让AI里的信号(也就是信息)在进入“假神经元”之前,先互相“聊个天”!科学家们就像在偷看咱们大脑里那些超级聪明的神经元(就是脑子里负责“思考”的小细胞),然后他们灵机一动:嘿!能不能让AI的“假神经元”也学学真神经元的骚操作?

啥意思呢?比如说,有个信号跑过来说:“我这儿有个想法,可能是只猫!”然后旁边的其他信号听了,点点头说:“对对对,绝对是猫,没跑儿!”这时候,这个“猫信号”就像被打了鸡血,变得更强更响亮,神经元收到后就更有信心处理它。

这事儿咋比喻呢?就像你有个神奇的果篮子,你往里扔水果,比如扔了个苹果。我在旁边看着,手里也有个果篮子。我会根据你扔的苹果,还有旁边小伙伴扔的啥(比如有人扔香蕉,有人扔橙子),决定我这篮子里是放苹果还是换成别的水果。有时候我直接照抄你的苹果,有时候我看情况换个别的,具体咋换得看大家扔了啥好货。因为这些水果(信号)在进篮子前能“商量”一下,最后我这篮子里的东西就变得更丰富、更有花样!

2、与任何现代LLM或视觉模型论文相比,这只是一个垃圾研究。没有使用流行的基准测试,报告的一些结果具有巨大的标准区间,模型比Transformer大5倍。因此,作者尝试了对Transformer架构的一些调整(有数千篇论文具有此前提),发现了一些模糊的基准,他们的模型似乎表现得更好,并添加了大量“来自自然/大脑/神经学的灵感”,好像它为实际结果增加了任何权重。

3、上下文场(CF2)简直就像大脑的"幕后导演"!

打个超形象的比方:

  • RF1(感受场) 是你在电影院看到的画面(客观信息)
  • CF2(上下文场) 是你手里的爆米花+邻座暗恋对象+明天要考试的心情(主观状态)

这个上下文场就像是你脑子里的“私人小助手”,专门负责把你的内心世界(比如饿了、困了、或者在想啥好玩的事儿)整理成信号,帮你的大脑决定咋处理外面的信息(感受场,RF1)。简单说,RF1是外面世界的“热闹广播”,而CF2是你心里的“独家小剧场”,两者得搭档干活,TPN细胞才能发挥大作用!

为啥说CF2特别重要呢?
因为它就像个“导演”,能决定你的脑子怎么“演绎”外面的信息

比如,你在看一部恐怖电影(RF1来的信号),如果你肚子饿得咕咕叫(CF2的信号),你可能压根儿不觉得电影吓人,满脑子只想着鸡腿!CF2会影响你对外部世界的反应,帮你的大脑根据“内心状态”调整优先级,决定啥信息更值得关注。所以,少了这个“内心小助手”,TPN细胞就没法那么聪明地处理信息,可能会像个没方向的机器人,只会傻乎乎地接收外面信号。

为什么CF2更牛?

  1. 决定你"怎么想"→ 同样的数学题,吃饱时觉得简单,饿肚子时觉得难哭
  2. 开启脑洞模式→ 发呆时听到音乐可能幻想出MV,上课时听到只会想"这节拍器好吵"

他们的Co4模型就是在模仿CF2和RF1的“双人舞”,让AI不仅能看懂外部信息,还能根据“内心状态”(比如任务的背景或目标)来判断啥更重要。这样AI就能像人一样,处理信息时更灵活、更聪明!