你上周告诉你家AI你对象叫啥
它转头就忘了
你花二十分钟跟它说你怎么写邮件。你喜欢开头客气一点,中间直接说事,结尾加个感谢。它说好的记住了。
今天你跟它说,帮我给老王写封邮件。它问,老王是谁。
你上周二明明说过,老王是你项目组的后端负责人。你不仅说了他叫啥,你还说了他负责用户认证模块,他脾气急但技术好,发邮件给他要简短别废话。
这些信息去哪了
不是你的设备坏了。不是你这个智能体买得便宜。是现在所有AI助理都有的毛病。它们记不住你。不是偶尔记不住。是一直记不住。
现在的AI助理怎么记东西
大部分智能体框架,包括OpenCLAW、Hermes这些,都用一个很笨的办法。它们把记忆存在文件里。Markdown文件、YAML文件、JSON文件。你告诉它一个事,它就往文件里写一行。
比如你说我喜欢喝冰美式。它就在某个叫MEMORY.md的文件里写一行:用户喜欢冰美式。
下次你问它,我喝咖啡要啥,它去文件里搜关键词咖啡,找到这条,告诉你冰美式。
听起来还行对吧
用了一周就崩了
文件越来越大。你每天都跟它聊天。今天说了项目进度,明天说了下周计划,后天说了你跟同事吵架的破事。每条对话它都写进文件。一个月后,几十个文件,几千行笔记。
问题来了。每次你跟它说话,不管说啥,它都把这几千行笔记全部塞进脑子里。你问今天天气咋样,它先把你这一个月聊过的所有废话都读一遍。什么你妈上周生日你忘了买礼物,什么你家的猫又把沙发抓烂了,全读。
这不浪费钱吗。按调用次数收费的模型,你每问一句天气,它都处理了几千行跟你现在问题毫无关系的破事。每句话都这样。永远这样。
然后还有更恶心的。对话长了以后,系统会自动压缩。你早上跟它聊了两个小时,下午再聊,中间那段对话被压缩成一行摘要。
早上你跟它说,我跟老王敲定了,认证模块的权限表结构改三个字段,明天上线。
下午你问它,认证模块那个权限表改哪三个字段了。
它说,你们讨论了项目计划。
这就完了。你那个决定在压缩的时候变成了一句废话。
最气人的是它连不上线索
周一你说,老王管认证团队。
周三你问,认证权限谁负责。
它知道老王这个人。它也知道认证权限这个事。但它没法把这两个信息连起来。所以它猜。猜得还挺自信。说可能是小李吧。
这不是它在骗你。是它那个记忆系统就是个垃圾堆。你把所有东西都扔进去,用的时候刨两下,刨到啥算啥。它不是真正的知识。就是一堆文本文件。
第一种办法:把文件整好点
大部分OpenCLAW用户就这么干的。认了,就用文件存,但把它整得精致一点。
他们把SOUL.md文件整得很精简。只放核心人设和硬性规则。把操作流程类的东西放到AGENTS.md。再加一条硬规则:每次我告诉你一个决定或者偏好,你立刻给我写到MEMORY.md里,先别回我话,写完了再回。
他们频繁用清空对话指令。一天至少清一次。这样你问今天天气的时候,不会把昨天聊的项目部署方案也带进去。
每隔几周手动清理一次记忆文件。删过期的,合并重复的。就跟收拾桌子似的。
这套办法能跑通的人,通常都是很克制的用法。一个智能体只干三四件事。你让它同时管五个项目,跨度三个月,这套就裂了。
成本是零块钱。代价是你得一直手动维护。
第二种办法:接个外部知识库
越来越多的人开始把自己家的智能体接到Obsidian、Joplin或者自己搭的知识库上。管这个叫第二大脑。
逻辑是这样的。你别搞一个巨大的MEMORY.md文件。你按主题、项目、人分好文件夹。Obsidian笔记本里,项目A一个文件夹,项目B一个文件夹,家里人信息一个文件夹。
社区里有个人把他全家的事都塞进Obsidian里接给OpenCLAW。财务文件,健康追踪,花园种菜计划,他儿子的紧急联系人信息。智能体需要啥就去对应文件夹查,不用每次把所有文件夹都读一遍。
问题来了。Obsidian本来是人用的笔记软件,你可以在里面点来点去浏览。但AI不是这么搜东西的。它要在一百个文件里做语义检索,找最相关的那条。Obsidian干不了这事。
你怎么办。你要么让智能体只读一个很小的文件夹,但这样会漏掉其他相关信息。要么你自己搭一套检索系统。恭喜你,你开始造轮子了。
还有个要命的事。你Obsidian里的每一条笔记,都会发给云端的大模型。你写的每一句心事,你拍的每一张财务单据,你记的每一次看病记录。全发到云端。有一篇Obsidian当记忆的教程里,专门写了一句警告:想清楚什么笔记放进这个系统。翻译成人话就是,这玩意儿隐私问题很严重。
成本是工具不花钱。但你要花大把时间搭这套东西。跑一个项目还行。规模一大就崩。
第三种办法:向量数据库
这是搞技术的人认为的正经解法。不用文件,不用文件夹。把每一条记忆变成一串数字,叫向量。智能体需要回忆的时候,它做语义搜索,只把最相关的那几条记忆找出来,而不是把全部东西塞进脑子里。
Hermes原生就支持这套,分三层。短期记忆管当前对话。中间层用SQLite归档过去的对话,支持搜索。最上层是技能层,智能体会从经验里自己写新技能。
有个叫mem0的团队发了数据。这套办法比直接把文件塞进上下文,减少了百分之七十到八十五的上下文用量。答案质量一样,但花掉的费用少很多。
Composio做了个对比。OpenCLAW是全局搜一遍,经常把过时的上下文也搜出来,反而把模型搞糊涂了。Hermes是分层拿,先查核心记忆,核心没有再去更宽的地方搜。更有章法,噪音更少。
OpenCLAW的用户现在自己在外面加Pinecone、ChromaDB或者mem0当记忆层。能跑通,但这是又多了一套要维护的基础设施。凌晨两点它挂了你就得爬起来修。
成本是向量库一个月零到二十美金。但你要花大量工程时间去搭。搭好以后是三种方案里效果最好的。
说点现实的
这三种都不咋地
第一种管用但没法扩大规模。第二种很聪明但本质上是在绕路。第三种架构对但大部分人没能力搭。
记忆问题是智能体显得蠢的唯一最大原因。不是模型不行。模型牛逼得吓人。GPT系列、Claude系列、Qwen系列,个个都够用。瓶颈就是你的智能体记不住上周跟你说的事。记住的话要么烧你几千个tokens的废话,要么逼你自己造一套检索系统。
谁先解决让智能体像人一样自然记住事,不用你管文件也不用你管数据库,谁就赢下这个赛道下一阶段的比赛。
在那之前,选一个你能忍的坑,躺平。