分类:解锁认知的核心密钥


霍夫斯塔德的《表面与本质》这本书很不错,是一本500页的书,讲的是思想的本质。他基本上是给你列了一大堆例子,来证明所有的思维归根结底都是靠类比(analogy、category )推动的。

他认为所有的想法都首先得有个分类(categorization  范畴):

认知就是把我们周围的世界分成不同的堆儿。人以群分,物以类聚,比如说,

  • 我们把一些东西分到“椅子”这堆儿里,
  • 把另一些东西分到“大”这堆儿里。
面向对象编程中,Class类是第一个设计的概念,就是源于这种分类思维。

对霍夫斯塔德来说,分类不只是名词和形容词,差不多每一个能认出来的心理概念都是一个分类。

他觉得“和and”也是一个分类,意思是“一个东西跟另一个东西凑一块儿,还能互相补点啥”的情况。(1+1>2

类比就是推动认知的核心
对霍夫斯塔德来说,类比就是推动这一切的那个过程。

类比/类别其实总有点松松垮垮的,没法完全给它定死。维特根斯坦就发现了这个事儿,他提出了“家族相似性family resemblance”的想法:就是说,一个类别里的成员,不一定全都一模一样,但它们有点像一家子人,互相之间有些相似的特点。比如“游戏”这个类别,足球、扑克、下棋都算进去,但它们没啥完全一样的标准,就有点像亲戚之间有点共同点。

“原型理论prototype theory”认为,我们头脑中的类别都有一个“中心示例”,它构成了类别构建的中心:比如说“鸟”,你可能会先想到麻雀,因为它最像“鸟”的典型样子,有翅膀、会飞、会叫。其他不太一样的,像企鹅、鸵鸟,就靠着跟这个中心的相似性被塞进“鸟”这个类别。这个中心示例就成了我们建类别的基础,跟搭积木似的,围着它往外扩。

类比其实就是根据两个想法在结构上的某种相似之处,把它们连系起来(比如拿巴黎和伦敦做类比——它们都是首都)。
类比是我们建立一个概念的过程,也就是最开始形成一个分类的过程。

我们先从一个核心例子开始(比如你的妈妈),然后通过一串类比,这个概念就变得更广,变成了抽象的“妈妈”这个想法。

类比还是我们把以前分开的分类连系起来的过程:

  • 伽利略抬头一看,看到木星旁边有些小点点,他就拿这些小点点跟离我们地球近的大点点——月亮——做了个类比。
  • 同样,牛顿被苹果砸了头,然后想到远处天体的运动,他也是在以前觉得不相关的概念之间做了类比,现在我们把这些看成一个东西——引力。

总之,霍夫斯塔德的想法是,这个类比的过程是创造力、科学思维、智能,还有我们学新概念的基础。这听起来挺高深的,

霍夫斯塔德是谁?
霍夫斯塔德(全名叫道格拉斯·霍夫斯塔德,Douglas Hofstadter)是一个美国的大牛,特别有名的学者和作家。他是研究认知科学、计算机科学和哲学的专家,简单来说就是研究人的思维是怎么工作的,还有计算机能不能像人一样思考。

他最出名的书是《哥德尔、艾舍尔、巴赫:一条永恒的金带》(简称GEB),这本书拿过大奖,超级难懂但也超级有意思,讲数学、艺术和音乐怎么跟思维连系起来。

他还有一本很重要的书叫《表面与本质》(跟别人一块儿写的),就是我之前跟你聊的那本,里面说所有的思想都是通过类比(比喻)来的。他爸是诺贝尔物理学奖得主,所以他从小就挺厉害的。他现在还是大学的教授,写的东西特别深,但也特别吸引人,喜欢让人脑洞大开。

网友:
听起来霍夫斯塔德说到了点子上,但 "category范畴 "的概念仍然是相当亚里士多德式的(并非贬义),也许不够灵活:

  • 我们从一般的机器学习 ML,尤其是 大模型LLM 中了解到的一点是,梯度下降可以通过最小化过程找到这些类比,并自行识别抽象概念。寻找类比/范畴的整个过程是最小化原则的结果,是对信息存储效率的不懈追求。

范畴category实际上不像数学里集合论那种死板的集合,得有个清晰的边界,而是更像分形(fractal)那样,边界乱七八糟的,甚至还能通过类比伸展出去,把所有能体验到或者想到的相似点都连起来。这样就能把一大堆乱七八糟的数据压缩到一个小一点、简单一点的“潜在空间流形”(latent space manifold)上。

类别不是一个框,非得把东西装得整整齐齐,而是像一张网,能伸能缩,碰到啥跟它有点像的,就往里扯一把。这样做的好处就是效率高,能把复杂的经历和想法压成一个更简单的小包袱存起来。比如你看到椅子、凳子、沙发,虽然样子不一样,但都有“能坐”这点相似,你脑子就懒得把它们分开记,直接压缩成一个“坐的东西”的概念。机器学习里也差不多,模型训练出来一个潜在空间,把相似的特征都捏一块儿,省空间还方便用。

这个比霍夫斯塔德的范畴灵活多了,他那套还是有点像在脑子里搭了个图书馆,每本书得有个明确的标签。你这个更像大脑或者AI在现实中真是咋干活的——边界模糊,能屈能伸。

LLM嵌入的概念可以用于类别和类比(category)。

分类是动物有的本能反应
一种感觉输入的模式产生反应。在某种程度上,动物涉及到一种柔软的本能机制。一个可以学习对(模糊)感觉输入模式的反应的东西。

比如一听到啥动静,或者看到啥东西,立马就知道该跑还是该扑上去。这就像一种“感觉输入-反应输出”的直线关系,特别干脆。不过你说得对,这不完全是死板的,动物的本能其实有点“软性”,不是那种机械的开关。

动物不光靠本能活着,它们还能学着调整反应。比如一条狗,一开始听见门铃可能吓一跳乱叫,但时间长了,它发现门铃一响就是有人送外卖,慢慢就学会摇尾巴等着了。这就是说,它们能根据模糊的感觉输入——比如声音、气味、光线啥的——摸索出点新反应。不是完全靠基因写死的程序,而是有点弹性,能在生活里打磨出来。

这个“柔软机制”跟category类比/类别有点像。动物的脑子可能也在干类似的事儿——把模糊的经验压成简单的模式,然后靠着这些模式活下去。跟机器学习也有点像,输入一堆乱七八糟的数据,慢慢调出个能用的反应。

类比的哲学历史
类比是一切事物的关键,但是这个话题有着更长的哲学谱系,可以追溯到希腊人。它从未在天主教思想中消失,因为它在阿奎那的治疗,尽管它在其他地方半途而废,现在正在享受一点复兴。

在古希腊哲学中,类比(analogia)被用来描述事物之间的相似性或比例关系。柏拉图在其对话录中经常使用类比来解释复杂的哲学概念,例如通过“洞穴寓言”来类比人类对真理的认知过程。

亚里士多德则进一步发展了类比的概念,将其应用于逻辑学、生物学和形而上学中,认为类比可以帮助我们理解不同事物之间的共同结构和功能。

在中世纪,类比的概念在天主教神学中得到了深化,尤其是在托马斯·阿奎那的著作中。阿奎那认为,类比是理解上帝与受造物之间关系的关键工具。由于上帝是无限的、超越的,而人类语言和概念是有限的,因此我们无法用直接的语言来描述上帝。类比允许我们通过受造物的有限属性来间接理解上帝的无限属性。例如,当我们说“上帝是善的”时,这种“善”并不是与人类的善完全相同,而是通过类比的方式表达了一种超越的、神圣的善。

阿奎那的类比理论不仅影响了神学,还对形而上学和认识论产生了深远的影响。类比成为了一种调和信仰与理性、神圣与世俗之间关系的重要工具。

随着现代哲学和科学的兴起,类比在某些领域逐渐被边缘化。特别是在启蒙时期,哲学家们更倾向于追求清晰、明确的定义和逻辑推理,而类比因其模糊性和隐喻性而被视为不够严谨。

近年来,随着后现代哲学和跨学科研究的兴起,类比正在经历某种程度的复兴。学者们重新认识到类比在理解复杂系统、跨文化对话以及科学与人文之间的桥梁作用。类比不仅帮助我们理解不同领域之间的相似性,还为我们提供了一种创造性的思维方式,能够突破传统二元对立的局限。

在现代语境中,类比的应用范围更加广泛。例如,在认知科学中,类比被认为是人类思维的核心机制之一,帮助我们通过已知的事物来理解未知的事物。在人工智能领域,类比推理也被视为一种重要的认知工具,能够帮助机器进行创造性思考和问题解决。

banq注:

  • 分而治之,分类是解决问题根本之道。
  • 切分从不同上下文、氛围开始,从环境、粗狂的家族相似性开始。