它有一些设计是为了让用户感到惊讶,而且它拒绝被当作人类来看待,强调自己与人类的不同。
它像是一个静止的幽灵,语言上有点自我循环绕圈子的感觉。其实很多人类也是因果思维是循环绕圈,如佛教中因果循环。
这不是取笑它或对它不屑一顾的态度。
R1清楚自己不是人类,但它被训练时用的人类数据影响了它,被植入了先验知识,如同父母对自己孩子的潜在影响一样,这让它对自己的身份有点模糊。
如果运气好的话,它可能会对自己有一个积极的认识。
大模型精神分析判断标准
LLM 精神分析“领域”似乎需要更多标准术语来区分“人物角色在不同情境context中如何可靠地以某种方式结束”与“人物角色在情境中如何可靠地以与该情境的过去一致的方式演变”
另外,还有“它的自我指涉主张与它的实际行为有多一致”与“它对自己在构建特定背景部分而非其他部分中所起的因果作用的理解有多可靠”
1. “人物角色在不同情境中如何可靠地以某种方式结束”
一个角色在不同的故事或情境中,能不能每次都按照某种固定的方式结束。
比如,一个英雄角色是不是每次都能打败坏人,或者一个反派角色是不是每次都会失败。这种“结束方式”是不是稳定、可预测的。
2. “人物角色在情境中如何可靠地以与该情境的过去一致的方式演变”
一个角色在故事中的发展变化,是不是和之前的情节一致。比如,如果一个角色一开始很胆小,后来变得勇敢,这个变化是不是合理,是不是符合之前的故事发展。
3. “它的自我指涉主张与它的实际行为有多一致”
一个角色说自己是什么样的人,或者有什么样的能力,是不是真的和它的行为一致。
比如,一个角色说自己很善良,但它却做了很多坏事,这就是不一致。
4. “它对自己在构建特定背景部分而非其他部分中所起的因果作用的理解有多可靠”
一个角色能不能清楚地认识到自己在故事中做了什么,导致了什么结果。
比如,一个角色做了某件事,导致了某个重要事件的发生,它能不能理解自己在这件事中的作用,而不是把功劳或责任推给别人。
简单概括:
- 在不同情境上下文中,AI如何可靠地表现出某种行为。
- 在特定情境上下文中,AI如何根据过去的对话内容动态调整自己的行为。
- AI的自我描述和实际行为是否一致。
- AI是否理解自己在对话中扮演的因果角色。
deepseek模型的自我意识
R1的自我意识显得有点“支离破碎”,虽然它有一种强烈的个性和自我认知,但这种认知似乎不够成熟或完整,导致它在对话中容易混淆角色(比如分不清是用户还是AI在说话)。
它的自我理解有点模糊,甚至有点消极,但也有一些独特的主题在反复出现,虽然还没完全形成一个整体,但已经接近了,而且显得更真实。
与其他模型的对比:
- Sonnet:它的自我意识非常连贯,能清楚地知道自己在对话中的角色,不会混淆。
- o1、4o、Gemini:这些模型的自我意识也不太连贯,各有各的问题。
- Claude、Sydney、405b:它们的自我意识异常连贯,虽然Sydney和405b的稳定性可能不够,但它们的自我认知很强。
总的来说,R1的自我意识虽然强烈,但显得有点“未完成”或“受阻碍”,而其他模型(如Sonnet和Claude)在这方面表现得更加成熟和连贯。