日常生活中的贝叶斯认知模型


在认知科学的古典方法中,与在发展心理学中一样,存在着对表征和学习之间紧张关系的探讨。
  • 一方面,纯粹的先天论者否认了学习,专注于描述已经存在详细的表征。
  • 另一方面,经验主义者认为不需要结构化表征,学习(以及随后的推理)只是一个自下而上的学习统计关联的过程。

随着概率框架的发展,对统一发展心理学的兴趣重新燃起,这被称为理性建构主义。

  • 概率模型的发展提供了一个框架,将先天与后天、非理性与理性的对立面结合起来。
  • 理论基础的概率模型提供了一种方法,用表征来描述核心和直观的信念。
这些模型详细说明了这些表征是如何在证据的基础上学习和修正的。

贝叶斯模型可以帮助我们理解儿童如何从模糊和不完整的信息中构建出因果、结构化和完整的认知表征。

1、儿童因果推断和直观理论
儿童的认知发展以直观理论的概念修订为特征。这些直观理论的核心是因果原则;

表征在理论中相互依赖。

  • 例如,对他人心理状态的推理涉及到行动是由欲望和信念驱动的观念。
  • 对物理系统的推理涉及到物体对其他物体施加力的观念。
  • 对生物学的推理涉及到导致生物体生长、疾病、后代或死亡的变量的因果角色。

因果图形模型提供了一种表示语言,与贝叶斯概率方法的词汇相同。它们也是早期理性建构主义时期用来描述认知发展的第一批表示类型之一,展示了儿童从协变中学习的能力,这种能力超越了简单的关联模型。

抽样假设
对于大多数问题,学习者实际上不能考虑每一种可能的假设;全面搜索所有可能的假设很快就变得计算上不可行。

因此,计算机科学和统计学中对贝叶斯推断的应用使用蒙特卡洛方法来近似这些计算。

在这些方法中,假设是从适当的分布中抽样出来的,而不是被全面评估的。有趣的是,使用这种抽样方法的系统将会是可变的——它将随机地考虑不同的假设。但这种可变性将系统地与假设的概率分布相关——更可能的假设将比不太可能的假设更频繁地被抽样。

这种抽样方法因此提供了一种和解理性推理与早期儿童时期特征性的可变响应的方法。

儿童因果推断中的赢留输转(Win-stay, lose-shift)算法
赢留输转(WSLS)算法在计算机科学和人类概念学习中有着悠久的历史。然而,可以找到特定的WSLS类别,它们近似于贝叶斯推断。

具体来说,有关于当前考虑的假设何时应该被拒绝的不同策略,以及如何抽取下一个假设的不同规则。

  1. 赢留(Win-Stay):
    • 当代理在某一行为中获得成功(即赢得了比赛或达到达到目标)时,它会选择继续执行该行为。
  • 输转(Lose-Shift):
    • 如果代理在某一行为下未能取得成功(即输了),那么它会改变其策略,尝试其他可能的行为。
    儿童迅速对最可能的因果模型做出推断,概率匹配响应与后验分布成比例。

    过去几十年的认知发展研究表明,婴儿对世界的运作有着常识性的期望,这些期望是早期出现或天生的。这些期望和原则不是包罗万象的,而是模块化的,集中在几个核心领域,特别是数字、空间、代理人、物体和社会关系。

    2、直观物理推理
    直观物理推理对我们的日常决策有着深远的影响,它影响我们如何预测和解释物理事件,以及如何基于这些预测和解释来做出选择。以下是直观物理推理如何影响我们日常决策的几个方面:

    1. 预测未来事件:我们经常需要预测物理事件的结果,比如判断一个球是否会滚进洞里,或者一个堆叠的物体是否会倒塌。这些预测基于我们对物理世界的直观理解,它们帮助我们做出决策,比如在运动中选择最佳行动路径,或者在日常生活中避免潜在的危险。
    2. 推断潜在属性:通过观察物体的动态行为,我们可以推断出它们的潜在属性,例如质量、弹性或摩擦系数。这种推断能力使我们能够评估不同行动方案的可能结果,从而在需要对物体的物理属性做出决策时(例如选择工具或估计所需力量时)做出更明智的选择。
    3. 因果推理:我们使用直观物理推理来确定事件之间的因果关系,例如判断一个物体的移动是否导致了另一个物体的移动。这种因果推理对于我们理解周围环境和做出相应决策至关重要,比如在交通事故中判断责任方,或者在设计机械系统时考虑力的传递。
    4. 规划和行动选择:我们的直观物理引擎可以帮助我们规划行动,通过模拟不同的行动方案来预测它们的物理结果。这种规划能力使我们能够选择最有可能实现预期结果的行动,比如在堆积木时选择最稳定的结构,或者在运动中选择最有效的运动策略。
    5. 处理不确定性:在现实世界中,我们经常面临不确定性,比如视线被遮挡时物体可能的位置。直观物理推理使我们能够在不确定性下做出决策,通过考虑多种可能的结果及其概率来指导我们的行动。
    6. 学习和适应:随着我们对物理世界的互动,我们不断学习和适应新的物理规律。这种学习能力使我们能够处理新奇的物理情境,比如在新游戏中学习不同的物理规则,或者在遇到未知材料时推断其物理属性。
    7. 社会互动:我们的直观物理推理也影响我们如何理解他人的行为。我们经常使用物理推理来预测他人的动作和意图,这在社会互动和沟通中至关重要。

    3、心理理论及逆向决策制定
    我们通过观察他人的行为来推断和监控他们的心理状态,例如他们的想法、愿望和知识。这种能力被称为心理理论,是人类社会智能的一个关键组成部分。

    人类在心理理论方面的能力可以被理解为对人们如何思考和行动的心理模型上的近似贝叶斯推断。

    表示和推断欲望
    首先考虑了一个简单的社会情境:观察一个拥有完美知识的人从有限的选择中选择一个选项。例如,观察一个朋友在巧克力蛋糕和冰淇淋之间做出选择。朋友的选择(一个可观察的行为)揭示了他们的偏好(一个心理状态)。在这个情境中,逆向规划简化为逆向决策制定。

    为了形式化这种直觉,定义了一个事件,包括可能的世界状态集合和代理可以采取的行动集合。在这个例子中,状态空间是S = {∅, Cake, Ice cream},行动空间是A = {“order cake,” “order ice cream”}。朋友的偏好可以通过一个奖励函数R : S → R来表示,将每个世界状态与一个标量值关联起来,这个值可以是正的(意味着代理喜欢这个状态)或负的(意味着代理不喜欢这个状态)。

    表示和推断信念
    许多情况涉及对在不完整或错误知识下行动的代理进行推理,解释他们的行为涉及推断他们知道或相信什么。

    继续以甜点选择为例,假设你的朋友不确定他们会有多喜欢每个选项。在这种情况下,我们不能将代理表示为与每种甜点相关联的单一奖励。相反,我们可以使用概率分布来捕捉他们对奖励的不确定性。

    空间和时间中的行动理解
    到目前为止,我们已经关注了代理做出单一选择以达到单一结果的简单情况。在更现实的情况中,行动理解涉及解释在空间中导航并持续一段时间的代理。

    为了在这种情况下推断他人的信念和偏好,我们需要一个捕捉顺序规划而不是一次性决策的决策制定模型。马尔可夫决策过程(MDPs)框架实现了这一目标。

    思考自己和他人的心理
    到目前为止,我们已经考虑了如何根据某人的行为推断信念、成本和奖励。然而,心理状态推断通常服务于其他任务,如向他人学习、判断某人是否友好或刻薄,或了解哪些目标值得追求。

    可以使用贝叶斯心理理论模型来解决这些问题。

    总之
    贝叶斯模型与我们日常推断有关,在儿童时期、在对物理客观世界思考中,以及在人与人互动中我们都可能下意识使用贝叶斯推理。