开源GBrain：读写循环、结构化知识与混合检索实现持续改进的记忆系统

#GitHub工具库推荐 #AI智能体Agent #OpenClaw #持续学习CL

2026-04-13 1 11K banq

GBrain用结构化知识库和自动循环机制，给AI装上持续增长的长期记忆，实现信息积累、认知优化与完全可控。

GBrain的本质不是“一个知识库工具”，而是把AI从“无记忆应答机器”升级成“持续进化的认知系统”。它通过“读→写→同步”的闭环，把你所有生活数据转化为结构化知识，再通过检索与上下文增强，让AI在每一次对话中变得更聪明。这种能力不是线性提升，而是随时间复利增长。

从“聪明但失忆”到“持续进化的大脑”

普通AI Agent的最大问题不是不聪明，而是没有长期记忆。每一次对话都像考试前失忆，回答只能依赖即时上下文和通用知识，结果就是反复从零开始，效率极低。GBrain直接解决这个问题，把会议、邮件、推文、日历、语音通话和个人想法全部变成可检索的结构化知识。

关键点在于它不是简单存储，而是强制AI在每次回答前执行“brain-first lookup”。也就是先查你的大脑，再回答问题。这个动作看似简单，本质却改变了AI行为模式，从“生成答案”变成“基于事实推理”。

进一步看，这个系统在每次对话后还会写回知识。你说过的话、做过的决策、见过的人，都会被记录、链接、整理。结果就是，AI不会遗忘，反而会不断积累上下文。时间一长，你得到的不是一个助手，而是一个逐渐接近“你第二大脑”的系统。

核心循环机制：让知识产生复利

GBrain的核心不是存储，而是循环：

信号进入 → 实体识别 → 读取历史 → 生成回答 → 写回知识 → 同步索引

这个循环每执行一次，就会增加一点知识。关键在于它是自动发生的。

举个典型场景：

你参加一个会议，AI生成会议记录，创建人物页面，链接公司信息，记录讨论内容。

下次再遇到这个人，AI已经知道历史背景、未完成事项、关系网络。

你没有额外操作，但系统已经完成了认知积累。

这种机制带来的结果不是线性增长，而是指数级增强。数据越多，关系越复杂，AI的理解能力越强。

检索系统本质：混合搜索才是真正智能

GBrain采用的是混合检索机制，而不是单一方法。

流程包括：

多查询扩展 → 向量搜索 → 关键词搜索 → RRF融合 → 去重过滤

这里最关键的是RRF（Reciprocal Rank Fusion），它把不同检索方式的结果融合。

向量搜索擅长语义理解，但容易丢失精确匹配。

关键词搜索精确，但无法理解抽象概念。

两者结合后，系统既能理解“意义”，又能抓住“细节”。

这就是为什么它能回答类似：

“我过去关于羞耻与创业者表现的观点是什么？”

这种问题普通搜索系统基本无法处理，因为它需要跨文档、跨时间、跨语义整合。

自动化系统：真正让大脑“活着”

GBrain不是一次性工具，而是持续运行的系统。它依赖定时任务维持运转：

每15分钟同步数据
每天检查更新
每晚执行dream cycle
每周健康检查

其中dream cycle最关键。

它会扫描所有数据，补全实体、修复引用、整合知识。

这一步相当于人类的睡眠整理记忆过程。没有它，系统只是在堆数据；有了它，系统开始“理解数据”。

这也是为什么作者强调不能跳过这个步骤，因为它直接决定系统是否产生复利。

架构本质：人类可控的AI认知系统

整体架构分为三层：

Brain Repo：人类可读的markdown
GBrain：检索与数据库层
AI Agent：读写执行层

关键点在于“human always wins”。

你可以直接修改markdown文件，系统会同步更新。这意味着最终控制权仍然在人类手中，而不是黑盒模型。

这种设计解决了AI系统常见的问题：不可控、不可解释。

在这里，每一条知识都有来源，每一次更新都有记录，每一个结论都可以追溯。

一个会持续进化的AI大脑如何解决记忆断裂问题

你已经用上一个超强AI，聊得正嗨。你告诉它你养了一只叫“二狗”的柯基，你妈讨厌狗毛，你上周刚买了无线吸尘器。AI帮你规划了每周三次的吸尘提醒，还开玩笑说“二狗掉毛能织毛衣”。你很满意，关掉对话框。第二天你重新打开，问AI：“二狗掉毛怎么办？” AI一脸懵：“二狗是谁？掉毛是什么情况？你需要我推荐吸尘器吗？” 你血压瞬间拉满。所有昨天聊得火热的信息，全部蒸发。这就是AI的绝症：没有长期记忆。每一次对话都像失忆症患者醒来，它不认识你，不记得你妈，更不知道二狗掉毛能绕地球三圈。你做的每个决策，产生的每个想法，全部丢失。认知无法累积，你永远在重复废话。你感觉自己在跟一条金鱼聊天，七秒后一切归零。

GBrain直接砸碎这个问题。系统把所有信息流统一拉进一个知识库。会议记录、邮件内容、日程安排、语音通话、临时想法，全部塞进同一个系统。你开会说的“下周三发布”，邮件里写的“预算砍掉20%”，语音里骂的“客户又改需求”，全部自动进库。信息不再散落在各个App里互相打架。它们进入一个持续增长的结构，像乐高积木一样越堆越高，每一块都卡得死死的。GBrain在每次回答前自动读取这个库，每次回答后自动写入新内容。你下一次问任何问题，AI先把整个库翻一遍，再张嘴说话。你问“二狗掉毛怎么办”，AI直接从库里调出“无线吸尘器、每周三次、你妈讨厌狗毛”全套方案。记忆断裂问题，从根上被焊死。

系统启动过程被压缩成标准流程，快得像泡面。数据库在极短时间内完成初始化，结构定义、向量索引、数据接入在几十分钟内搞定。你只需要给系统必要的访问权限，比如“你可以读我的日历”和“你可以看我的邮件”，然后系统就开始持续运行。复杂系统不再依赖长期搭建，那些动不动搭建三个月的企业级方案见鬼去吧。GBrain依赖一次性配置，配完就自动跑，像冰箱插上电就开始制冷，你不用天天守着。

闭环架构如何让信息不断转化为认知能力


┌──────────────────┐    ┌───────────────┐    ┌──────────────────┐
│   Brain Repo     │    │    GBrain     │    │    AI Agent      │
│   (git)          │    │  (retrieval)  │    │  (read/write)    │
│                  │    │               │    │                  │
│  markdown files  │───>│  Postgres +   │<──>│  skills define   │
│  = source of     │    │  pgvector     │    │  HOW to use the  │
│    truth         │    │               │    │  brain           │
│                  │<───│  hybrid       │    │                  │
│  human can       │    │  search       │    │  entity detect   │
│  always read     │    │  (vector +    │    │  enrich          │
│  & edit          │    │   keyword +   │    │  ingest          │
│                  │    │   RRF)        │    │  brief           │
└──────────────────┘    └───────────────┘    └──────────────────┘

这个结构形成一个持续运转的闭环，像你扔出去的回旋镖，飞一圈自己回来。知识以markdown格式存储，作为唯一事实来源。markdown文件就是最朴素的文本文件，你用记事本都能打开。数据被写入数据库后，通过检索系统被读取，再由AI处理并重新写回。信息在系统内部不断循环，像血液在心脏和血管之间来回泵。每一次循环都增加新的关系与上下文。信息不只是累积，而是被重新组织。你昨天记了“客户王总喜欢喝美式”，今天记了“王总说预算加到50万”，系统自动把这两条连起来。明天你问“怎么跟王总聊”，系统直接告诉你“提预算的事，顺便说给他带杯美式”。系统能力随着循环次数提升，不需要人工干预。你睡得跟死猪一样，系统还在自己转。

这个架构同时保持完全透明。所有数据最终都回到文本文件中，你可以直接查看和修改。你用记事本打开那个文件，看到“王总美式预算50万”，你觉得不对，改成“王总拿铁预算60万”，系统自动同步更新。系统没有隐藏层，没有那种“我也不知道AI为什么这么想”的黑盒。所有认知过程都可以被追溯。你问AI“为什么推荐拿铁”，AI调出记录：“因为你在2026年4月13日14:32分修改了文件”。你当场服气。

事实来源机制如何确保系统稳定与可控

仓库作为唯一事实来源，检索层只负责读取与加速，执行层只负责读写。系统通过这种分层结构保证数据不会被不可控修改。你想想传统数据库，一个bug就能把所有数据改成一坨屎。GBrain不干这种事。仓库里的markdown文件是铁打的营盘，检索层和AI层是流水的兵。AI乱写？没关系，它只能写回仓库，但你随时可以撤回。检索层抽风？没关系，它只读数据，改不了原始文件。

你可以直接编辑任何一条记录，系统会自动同步更新。你打开文件把“预算60万”改成“预算80万”，保存文件。GBrain下次检索时自动读到新数字。这种机制确保所有知识都可验证。每一个结论都可以追溯到具体记录。AI说“王总预算80万”，你问“证据呢？”，AI直接给你看那个文件修改时间戳。每一次更新都有明确来源，不是你猜的，不是AI编的，是你自己亲手改的。

系统因此具备稳定性。信息不会被随意篡改，推理过程可以被检查。AI只在已有知识基础上工作，所有输出都有依据。AI不会突然发疯说“王总预算一个亿”，因为仓库里没有这条记录。AI也不敢瞎编，因为每次回答前都要先读仓库。这种结构同时保证控制权始终在你手中。系统不会替代判断，只会增强处理能力。你说“我觉得王总预算还是60万”，系统说“好的，已更新”，然后闭嘴。你是老板，AI只是打工的。

知识结构如何从简单记录演化为认知网络

系统强制采用结构化方式组织信息。人物、公司、概念被分别归类，每一类信息形成独立集合。信息不再是孤立内容，而是可识别实体。你记“张三，销售总监，爱打羽毛球”，系统把“张三”归到人物类。你记“云图科技，做边缘计算，融资B轮”，系统把“云图科技”归到公司类。你记“边缘计算，低延迟，适用于物联网”，系统把“边缘计算”归到概念类。每一类都是一个独立集合，像图书馆不同书架，不会把小说塞进工具书区域。

每一个页面分为两个部分。上半部分是当前结论，用于表达最新认知。下半部分是历史记录，用于保存原始事实。结论可以更新，历史只允许追加。你第一次记“张三喜欢打羽毛球”，上半部分写“张三爱好：羽毛球”。后来张三告诉你“我膝盖受伤了，改游泳了”。你更新上半部分为“张三爱好：游泳”。下半部分追加一条“2026年4月13日：原记录羽毛球，因膝盖受伤改为游泳”。结论与证据同时存在，并保持清晰关系。

这种分层结构解决了信息处理中的核心矛盾。系统既可以持续优化认知，又不会丢失原始数据。你以后问“张三喜欢什么运动”，AI回答“游泳”。你问“他不是喜欢羽毛球吗？”，AI说“他膝盖受伤了，4月13日改的，你要看原始记录吗？” 你点开一看，服了。信息之间开始形成网络。实体之间建立连接，历史记录提供上下文，结论提供抽象理解。张三在云图科技工作，云图科技做边缘计算，边缘计算需要低延迟。系统自动把这三条连成一条知识链。系统从记录工具转变为认知结构，不再是你随手记的破本子，而是一个活的神经网络。

循环机制如何推动知识产生持续增长

系统围绕一个固定流程运行，跟工厂流水线一样丝滑。新信息进入后被识别为实体，与已有数据建立关系。系统读取历史信息生成响应，再把新内容写回数据库。你发一封邮件说“下周三评审会，张三主讲”。系统识别出“下周三”是时间实体，“评审会”是事件实体，“张三”是人物实体。系统去库里查张三，发现张三在云图科技，爱好游泳。系统自动把“评审会”和“云图科技”挂上钩。整个过程自动执行，不需要额外操作。你连屁股都不用抬一下。

你参与一次会议，系统自动生成记录并更新相关实体。你开完会骂了一句“张三今天讲得跟屎一样”，系统自动在张三的记录里追加一条“2026年4月13日，评审会表现差”。下一次出现相关信息时，系统已经具备完整上下文。你下次问“张三靠谱吗？”，系统说“他上一次评审会表现差，但之前游泳爱好记录正常，建议再观察一次”。系统不是瞎猜，是真有数据。

随着数据增加，关系数量快速增长。信息之间相互连接，形成复杂结构。你记了100个人，200个事件，300个概念。这些实体之间的连接数量不是100+200+300=600，而是像蜘蛛网一样指数级增长。张三认识李四，李四在王五公司，王五公司跟云图科技合作，云图科技用边缘计算。一条线串起一堆信息。系统能力随之增强。这种增长方式具有累积效应。数据越多，推理能力越强。系统逐步形成稳定的认知网络，像你大脑里的神经元，越用越粗壮。

混合检索机制如何实现理解与匹配统一

系统采用多种检索方式组合运行，像你同时用谷歌、百度和必应搜同一个问题。语义检索负责理解内容含义，关键词检索负责匹配具体信息。你说“那个爱游泳的销售总监”，语义检索理解“爱游泳”和“销售总监”这两个含义，去库里找跟游泳和销售相关的内容。关键词检索直接搜“游泳”“销售总监”这些字眼。不同方法同时运行，结果被统一整合。语义找到张三，关键词也找到张三，双重确认，稳了。

整合过程通过排序融合完成。不同来源的结果被重新排序，系统选择最相关内容。语义检索给张三打分95，关键词检索给张三打分90，另一个模糊匹配给李四打分60。系统把分数加权平均，张三胜出。重复信息被过滤，比如语义和关键词都返回同一封邮件，系统只保留一份。最终输出结构化结果，不是一堆乱码。

这种方式使系统能够处理复杂问题。你问“上次跟云图科技开会，张三表现怎么样？”，系统跨时间找“上次”是哪一天，跨文档找“云图科技”相关的会议记录，再跨实体找“张三”的表现评价。系统把三坨信息拼成一块完整答案：“2026年4月13日评审会，张三主讲，表现差”。信息可以跨时间、跨文档进行整合。系统不仅找到数据，还能够理解问题并重组答案。检索过程因此从简单查找转变为认知处理。系统具备理解能力，而不是单纯匹配能力。你不需要精确输入“2026年4月13日云图科技评审会张三表现”，你随便问，系统自己悟。

自动调度机制如何让系统持续优化

系统通过定时任务保持运行状态，像你设的早上7点闹钟，雷打不动。数据同步、更新检查、结构维护在固定时间执行。系统每天早上6点自动跟你的日历、邮件、语音记录同步一次。你凌晨3点写的一封邮件，系统6点就拉进来。你改了哪个文件，系统6点也发现。系统始终保持活跃，不会偷懒睡觉。

关键步骤是周期性整理过程。系统扫描所有数据，补全缺失信息，修复错误连接，优化整体结构。你记了“张三喜欢游泳”，但忘了记“张三在云图科技”。系统扫描时发现张三这个实体缺了“公司”属性，自动去邮件里搜“张三云图科技”，找到一封邮件里写“张三@云图科技”，系统自动补上。信息从分散状态转为有序结构。这个过程持续进行，不依赖人工干预。你不用半夜爬起来喊“系统你该整理了”，它自己会做。

结果非常明确。每一次整理都会提升整体质量。系统昨天把张三的公司补上了，今天把李四的职位补上了，明天把王五的电话补上了。你什么都不用干，系统自己越来越聪明。系统能力随时间稳定提升，像你养的一盆花，你只管浇水（给权限），它自己长叶子开花。

生产级运行机制如何形成完整操作体系

系统在实际环境中已经形成稳定运行模式，不是实验室里的玩具。大量数据被自动处理，实体数量持续增加，历史记录不断扩展。有人用GBrain处理了两年邮件，累计10万封，系统自动识别出5000个实体，包括3000个人、1500家公司、500个概念。历史记录堆到几十万条。系统跑得稳稳的，没崩过一次。

核心在于操作策略。系统定义明确规则，指导何时读取数据，何时写入数据，如何处理信息。
规则一：每次回答前必须读库。
规则二：每次回答后必须写库。
规则三：实体识别优先级按人物>公司>概念排序。
规则四：冲突信息以最新时间戳为准。行为由规则驱动，而不是随机执行。系统不会今天心情好就多读点，明天心情差就少写点。它像个偏执狂，每条规则都严格执行。

多个机制协同工作。循环机制负责增长，像心脏泵血。实体识别负责结构化，像骨架撑起身体。数据处理流程负责质量控制，像免疫系统清除坏细胞。定时任务负责持续运行，像呼吸一样不停。系统从工具集合转变为完整体系。AI具备明确行为模式，可以独立完成知识管理任务。你明天去度假，系统自己在家转得飞起。你回来问“这几天有什么新东西？”，系统说“你不在的这几天，来了37封邮件，我帮你整理了12个新实体，修复了8个错误连接，你要看报告吗？” 你当场想给它发年终奖。

分层结构如何实现不同类型信息协同工作

系统将信息分为不同层级。长期知识层负责存储世界信息，包括人物、组织、事件与概念。你记的“张三在云图科技”“边缘计算定义”“2026年4月13日评审会”全部堆在这一层。操作层负责存储行为规则与决策逻辑。你定义的“每次回答前必须读库”“冲突时取最新时间戳”放在这一层。当前上下文层负责处理即时对话。你跟AI说“今天心情不好”，AI把这句话临时记在这一层，聊完可能就扔。

不同层级承担不同职责。长期层提供事实基础，像图书馆的藏书。操作层提供行为指导，像图书馆的管理员手册。即时层提供当前语境，像你进图书馆时跟管理员说的“我今天想找关于狗的书”。三者共同参与决策过程。你问“二狗掉毛怎么办”，即时层记录“用户问掉毛”，操作层调取规则“优先从长期层检索相关实体”，长期层返回“二狗、柯基、无线吸尘器、你妈讨厌狗毛”。系统在运行时同时访问三层信息。输出结果基于完整数据结构，而不是单一来源。AI不会只看长期层忽略你刚说的“今天心情不好”，也不会只看即时层忘了二狗是谁。

这种分层设计避免信息混乱。不同类型数据各自独立，同时保持协同。长期层不会因为你今天心情不好就把二狗删了。即时层不会因为你昨天记了“二狗掉毛”就永远占着内存不释放。三层各干各的活，又配合得像一支乐队。鼓手打长期层的稳定节奏，贝斯手弹操作层的固定低音，主唱唱即时层的即兴旋律。你听到的是一首完整的歌，不是噪音。

GBrain 和 OpenClaw/Hermes 的关系

- GBrain 负责“你知道什么”——比如谁是谁、哪个公司、谈了什么买卖、开了什么会、有什么想法概念、或者你原创的思考。它就像你的长期记忆，存着你对这个世界的认知。
- OpenClaw 的 Agent 记忆（memory_search） 负责“它该怎么干活”——比如偏好、做过的决定、当前会话的上下文、这个 Agent 应该用什么方式行事。

它们是互补的，分工如下：

- GBrain 层：存的是人、公司、会议、想法、媒体等。查它就用 gbrain search、gbrain query、gbrain get。
- Agent 记忆层：存的是偏好、决策、运行配置。查它就用 memory_search。
- 会话上下文层：存的是当前这次对话的内容。这个一般是自动的。

实际用的时候，三层都要查：
- 查世界里的客观事实 → 用 GBrain
- 查 Agent 的配置和偏好 → 用 Agent 记忆
- 查当前聊到哪了 → 用会话上下文

安装方式：执行 openclaw skills install gbrain。

总结

GBrain通过读写循环、结构化知识与混合检索，让AI从无记忆工具进化为可持续成长的认知系统，实现知识的时间复利积累。

gbrain 0.8.0版本

gbrain这次更新到0.8.0版本后，你的AI助手（openclaw/hermes）就能接电话了。打开浏览器就能用，只需要一个OpenAI的账号，Twilio的电话号码是可选的（不配也能用）。

之前，gbrain像个闷葫芦——能存东西、搜索、查资料，就是不会说话。

现在：

→ 升级到0.8.0后，AI自己会主动问你要不要开通语音功能
用的是WebRTC技术，完全不用配置，上手就能用。然后它会问你电话号码。以后每次升级，新功能都会这么主动推销自己。

→ AI会自己取名字、定性格
它不会冷冰冰地说"请问有什么可以帮您"，而是会直接来一句"兄弟，今天你的社交雷达发现了点猛料"，因为内置了"互动热情度"的预判机制。

→ 内置25个实用功能模板
包括：以对话背景为先的提示词、主动提建议的模式、来电转接、卡住时自动恢复、调用工具时发出"思考中"的声音、降噪、提示词压缩（从1.3万个字符压缩到4700个）。

说不定我真会让它给我妈打个电话——她终于有个能听她说话的人了。