GBrain用结构化知识库和自动循环机制,给AI装上持续增长的长期记忆,实现信息积累、认知优化与完全可控。
GBrain的本质不是“一个知识库工具”,而是把AI从“无记忆应答机器”升级成“持续进化的认知系统”。它通过“读→写→同步”的闭环,把你所有生活数据转化为结构化知识,再通过检索与上下文增强,让AI在每一次对话中变得更聪明。这种能力不是线性提升,而是随时间复利增长。
从“聪明但失忆”到“持续进化的大脑”
普通AI Agent的最大问题不是不聪明,而是没有长期记忆。每一次对话都像考试前失忆,回答只能依赖即时上下文和通用知识,结果就是反复从零开始,效率极低。GBrain直接解决这个问题,把会议、邮件、推文、日历、语音通话和个人想法全部变成可检索的结构化知识。
关键点在于它不是简单存储,而是强制AI在每次回答前执行“brain-first lookup”。也就是先查你的大脑,再回答问题。这个动作看似简单,本质却改变了AI行为模式,从“生成答案”变成“基于事实推理”。
进一步看,这个系统在每次对话后还会写回知识。你说过的话、做过的决策、见过的人,都会被记录、链接、整理。结果就是,AI不会遗忘,反而会不断积累上下文。时间一长,你得到的不是一个助手,而是一个逐渐接近“你第二大脑”的系统。
核心循环机制:让知识产生复利
GBrain的核心不是存储,而是循环:
信号进入 → 实体识别 → 读取历史 → 生成回答 → 写回知识 → 同步索引
这个循环每执行一次,就会增加一点知识。关键在于它是自动发生的。
举个典型场景:
你参加一个会议,AI生成会议记录,创建人物页面,链接公司信息,记录讨论内容。
下次再遇到这个人,AI已经知道历史背景、未完成事项、关系网络。
你没有额外操作,但系统已经完成了认知积累。
这种机制带来的结果不是线性增长,而是指数级增强。数据越多,关系越复杂,AI的理解能力越强。
检索系统本质:混合搜索才是真正智能
GBrain采用的是混合检索机制,而不是单一方法。
流程包括:
多查询扩展 → 向量搜索 → 关键词搜索 → RRF融合 → 去重过滤
这里最关键的是RRF(Reciprocal Rank Fusion),它把不同检索方式的结果融合。
向量搜索擅长语义理解,但容易丢失精确匹配。
关键词搜索精确,但无法理解抽象概念。
两者结合后,系统既能理解“意义”,又能抓住“细节”。
这就是为什么它能回答类似:
“我过去关于羞耻与创业者表现的观点是什么?”
这种问题普通搜索系统基本无法处理,因为它需要跨文档、跨时间、跨语义整合。
自动化系统:真正让大脑“活着”
GBrain不是一次性工具,而是持续运行的系统。它依赖定时任务维持运转:
每15分钟同步数据
每天检查更新
每晚执行dream cycle
每周健康检查
其中dream cycle最关键。
它会扫描所有数据,补全实体、修复引用、整合知识。
这一步相当于人类的睡眠整理记忆过程。没有它,系统只是在堆数据;有了它,系统开始“理解数据”。
这也是为什么作者强调不能跳过这个步骤,因为它直接决定系统是否产生复利。
架构本质:人类可控的AI认知系统
整体架构分为三层:
Brain Repo:人类可读的markdown
GBrain:检索与数据库层
AI Agent:读写执行层
关键点在于“human always wins”。
你可以直接修改markdown文件,系统会同步更新。这意味着最终控制权仍然在人类手中,而不是黑盒模型。
这种设计解决了AI系统常见的问题:不可控、不可解释。
在这里,每一条知识都有来源,每一次更新都有记录,每一个结论都可以追溯。
一个会持续进化的AI大脑如何解决记忆断裂问题
你已经用上一个超强AI,聊得正嗨。你告诉它你养了一只叫“二狗”的柯基,你妈讨厌狗毛,你上周刚买了无线吸尘器。AI帮你规划了每周三次的吸尘提醒,还开玩笑说“二狗掉毛能织毛衣”。你很满意,关掉对话框。第二天你重新打开,问AI:“二狗掉毛怎么办?” AI一脸懵:“二狗是谁?掉毛是什么情况?你需要我推荐吸尘器吗?” 你血压瞬间拉满。所有昨天聊得火热的信息,全部蒸发。这就是AI的绝症:没有长期记忆。每一次对话都像失忆症患者醒来,它不认识你,不记得你妈,更不知道二狗掉毛能绕地球三圈。你做的每个决策,产生的每个想法,全部丢失。认知无法累积,你永远在重复废话。你感觉自己在跟一条金鱼聊天,七秒后一切归零。
GBrain直接砸碎这个问题。系统把所有信息流统一拉进一个知识库。会议记录、邮件内容、日程安排、语音通话、临时想法,全部塞进同一个系统。你开会说的“下周三发布”,邮件里写的“预算砍掉20%”,语音里骂的“客户又改需求”,全部自动进库。信息不再散落在各个App里互相打架。它们进入一个持续增长的结构,像乐高积木一样越堆越高,每一块都卡得死死的。GBrain在每次回答前自动读取这个库,每次回答后自动写入新内容。你下一次问任何问题,AI先把整个库翻一遍,再张嘴说话。你问“二狗掉毛怎么办”,AI直接从库里调出“无线吸尘器、每周三次、你妈讨厌狗毛”全套方案。记忆断裂问题,从根上被焊死。
系统启动过程被压缩成标准流程,快得像泡面。数据库在极短时间内完成初始化,结构定义、向量索引、数据接入在几十分钟内搞定。你只需要给系统必要的访问权限,比如“你可以读我的日历”和“你可以看我的邮件”,然后系统就开始持续运行。复杂系统不再依赖长期搭建,那些动不动搭建三个月的企业级方案见鬼去吧。GBrain依赖一次性配置,配完就自动跑,像冰箱插上电就开始制冷,你不用天天守着。
闭环架构如何让信息不断转化为认知能力
┌──────────────────┐ ┌───────────────┐ ┌──────────────────┐
│ Brain Repo │ │ GBrain │ │ AI Agent │
│ (git) │ │ (retrieval) │ │ (read/write) │
│ │ │ │ │ │
│ markdown files │───>│ Postgres + │<──>│ skills define │
│ = source of │ │ pgvector │ │ HOW to use the │
│ truth │ │ │ │ brain │
│ │<───│ hybrid │ │ │
│ human can │ │ search │ │ entity detect │
│ always read │ │ (vector + │ │ enrich │
│ & edit │ │ keyword + │ │ ingest │
│ │ │ RRF) │ │ brief │
└──────────────────┘ └───────────────┘ └──────────────────┘
这个结构形成一个持续运转的闭环,像你扔出去的回旋镖,飞一圈自己回来。知识以markdown格式存储,作为唯一事实来源。markdown文件就是最朴素的文本文件,你用记事本都能打开。数据被写入数据库后,通过检索系统被读取,再由AI处理并重新写回。信息在系统内部不断循环,像血液在心脏和血管之间来回泵。每一次循环都增加新的关系与上下文。信息不只是累积,而是被重新组织。你昨天记了“客户王总喜欢喝美式”,今天记了“王总说预算加到50万”,系统自动把这两条连起来。明天你问“怎么跟王总聊”,系统直接告诉你“提预算的事,顺便说给他带杯美式”。系统能力随着循环次数提升,不需要人工干预。你睡得跟死猪一样,系统还在自己转。
这个架构同时保持完全透明。所有数据最终都回到文本文件中,你可以直接查看和修改。你用记事本打开那个文件,看到“王总 美式 预算50万”,你觉得不对,改成“王总 拿铁 预算60万”,系统自动同步更新。系统没有隐藏层,没有那种“我也不知道AI为什么这么想”的黑盒。所有认知过程都可以被追溯。你问AI“为什么推荐拿铁”,AI调出记录:“因为你在2026年4月13日14:32分修改了文件”。你当场服气。
事实来源机制如何确保系统稳定与可控
仓库作为唯一事实来源,检索层只负责读取与加速,执行层只负责读写。系统通过这种分层结构保证数据不会被不可控修改。你想想传统数据库,一个bug就能把所有数据改成一坨屎。GBrain不干这种事。仓库里的markdown文件是铁打的营盘,检索层和AI层是流水的兵。AI乱写?没关系,它只能写回仓库,但你随时可以撤回。检索层抽风?没关系,它只读数据,改不了原始文件。
你可以直接编辑任何一条记录,系统会自动同步更新。你打开文件把“预算60万”改成“预算80万”,保存文件。GBrain下次检索时自动读到新数字。这种机制确保所有知识都可验证。每一个结论都可以追溯到具体记录。AI说“王总预算80万”,你问“证据呢?”,AI直接给你看那个文件修改时间戳。每一次更新都有明确来源,不是你猜的,不是AI编的,是你自己亲手改的。
系统因此具备稳定性。信息不会被随意篡改,推理过程可以被检查。AI只在已有知识基础上工作,所有输出都有依据。AI不会突然发疯说“王总预算一个亿”,因为仓库里没有这条记录。AI也不敢瞎编,因为每次回答前都要先读仓库。这种结构同时保证控制权始终在你手中。系统不会替代判断,只会增强处理能力。你说“我觉得王总预算还是60万”,系统说“好的,已更新”,然后闭嘴。你是老板,AI只是打工的。
知识结构如何从简单记录演化为认知网络
系统强制采用结构化方式组织信息。人物、公司、概念被分别归类,每一类信息形成独立集合。信息不再是孤立内容,而是可识别实体。你记“张三,销售总监,爱打羽毛球”,系统把“张三”归到人物类。你记“云图科技,做边缘计算,融资B轮”,系统把“云图科技”归到公司类。你记“边缘计算,低延迟,适用于物联网”,系统把“边缘计算”归到概念类。每一类都是一个独立集合,像图书馆不同书架,不会把小说塞进工具书区域。
每一个页面分为两个部分。上半部分是当前结论,用于表达最新认知。下半部分是历史记录,用于保存原始事实。结论可以更新,历史只允许追加。你第一次记“张三喜欢打羽毛球”,上半部分写“张三爱好:羽毛球”。后来张三告诉你“我膝盖受伤了,改游泳了”。你更新上半部分为“张三爱好:游泳”。下半部分追加一条“2026年4月13日:原记录羽毛球,因膝盖受伤改为游泳”。结论与证据同时存在,并保持清晰关系。
这种分层结构解决了信息处理中的核心矛盾。系统既可以持续优化认知,又不会丢失原始数据。你以后问“张三喜欢什么运动”,AI回答“游泳”。你问“他不是喜欢羽毛球吗?”,AI说“他膝盖受伤了,4月13日改的,你要看原始记录吗?” 你点开一看,服了。信息之间开始形成网络。实体之间建立连接,历史记录提供上下文,结论提供抽象理解。张三在云图科技工作,云图科技做边缘计算,边缘计算需要低延迟。系统自动把这三条连成一条知识链。系统从记录工具转变为认知结构,不再是你随手记的破本子,而是一个活的神经网络。
循环机制如何推动知识产生持续增长
系统围绕一个固定流程运行,跟工厂流水线一样丝滑。新信息进入后被识别为实体,与已有数据建立关系。系统读取历史信息生成响应,再把新内容写回数据库。你发一封邮件说“下周三评审会,张三主讲”。系统识别出“下周三”是时间实体,“评审会”是事件实体,“张三”是人物实体。系统去库里查张三,发现张三在云图科技,爱好游泳。系统自动把“评审会”和“云图科技”挂上钩。整个过程自动执行,不需要额外操作。你连屁股都不用抬一下。
你参与一次会议,系统自动生成记录并更新相关实体。你开完会骂了一句“张三今天讲得跟屎一样”,系统自动在张三的记录里追加一条“2026年4月13日,评审会表现差”。下一次出现相关信息时,系统已经具备完整上下文。你下次问“张三靠谱吗?”,系统说“他上一次评审会表现差,但之前游泳爱好记录正常,建议再观察一次”。系统不是瞎猜,是真有数据。
随着数据增加,关系数量快速增长。信息之间相互连接,形成复杂结构。你记了100个人,200个事件,300个概念。这些实体之间的连接数量不是100+200+300=600,而是像蜘蛛网一样指数级增长。张三认识李四,李四在王五公司,王五公司跟云图科技合作,云图科技用边缘计算。一条线串起一堆信息。系统能力随之增强。这种增长方式具有累积效应。数据越多,推理能力越强。系统逐步形成稳定的认知网络,像你大脑里的神经元,越用越粗壮。
混合检索机制如何实现理解与匹配统一
系统采用多种检索方式组合运行,像你同时用谷歌、百度和必应搜同一个问题。语义检索负责理解内容含义,关键词检索负责匹配具体信息。你说“那个爱游泳的销售总监”,语义检索理解“爱游泳”和“销售总监”这两个含义,去库里找跟游泳和销售相关的内容。关键词检索直接搜“游泳”“销售总监”这些字眼。不同方法同时运行,结果被统一整合。语义找到张三,关键词也找到张三,双重确认,稳了。
整合过程通过排序融合完成。不同来源的结果被重新排序,系统选择最相关内容。语义检索给张三打分95,关键词检索给张三打分90,另一个模糊匹配给李四打分60。系统把分数加权平均,张三胜出。重复信息被过滤,比如语义和关键词都返回同一封邮件,系统只保留一份。最终输出结构化结果,不是一堆乱码。
这种方式使系统能够处理复杂问题。你问“上次跟云图科技开会,张三表现怎么样?”,系统跨时间找“上次”是哪一天,跨文档找“云图科技”相关的会议记录,再跨实体找“张三”的表现评价。系统把三坨信息拼成一块完整答案:“2026年4月13日评审会,张三主讲,表现差”。信息可以跨时间、跨文档进行整合。系统不仅找到数据,还能够理解问题并重组答案。检索过程因此从简单查找转变为认知处理。系统具备理解能力,而不是单纯匹配能力。你不需要精确输入“2026年4月13日云图科技评审会张三表现”,你随便问,系统自己悟。
自动调度机制如何让系统持续优化
系统通过定时任务保持运行状态,像你设的早上7点闹钟,雷打不动。数据同步、更新检查、结构维护在固定时间执行。系统每天早上6点自动跟你的日历、邮件、语音记录同步一次。你凌晨3点写的一封邮件,系统6点就拉进来。你改了哪个文件,系统6点也发现。系统始终保持活跃,不会偷懒睡觉。
关键步骤是周期性整理过程。系统扫描所有数据,补全缺失信息,修复错误连接,优化整体结构。你记了“张三喜欢游泳”,但忘了记“张三在云图科技”。系统扫描时发现张三这个实体缺了“公司”属性,自动去邮件里搜“张三 云图科技”,找到一封邮件里写“张三@云图科技”,系统自动补上。信息从分散状态转为有序结构。这个过程持续进行,不依赖人工干预。你不用半夜爬起来喊“系统你该整理了”,它自己会做。
结果非常明确。每一次整理都会提升整体质量。系统昨天把张三的公司补上了,今天把李四的职位补上了,明天把王五的电话补上了。你什么都不用干,系统自己越来越聪明。系统能力随时间稳定提升,像你养的一盆花,你只管浇水(给权限),它自己长叶子开花。
生产级运行机制如何形成完整操作体系
系统在实际环境中已经形成稳定运行模式,不是实验室里的玩具。大量数据被自动处理,实体数量持续增加,历史记录不断扩展。有人用GBrain处理了两年邮件,累计10万封,系统自动识别出5000个实体,包括3000个人、1500家公司、500个概念。历史记录堆到几十万条。系统跑得稳稳的,没崩过一次。
核心在于操作策略。系统定义明确规则,指导何时读取数据,何时写入数据,如何处理信息。
规则一:每次回答前必须读库。
规则二:每次回答后必须写库。
规则三:实体识别优先级按人物>公司>概念排序。
规则四:冲突信息以最新时间戳为准。行为由规则驱动,而不是随机执行。系统不会今天心情好就多读点,明天心情差就少写点。它像个偏执狂,每条规则都严格执行。
多个机制协同工作。循环机制负责增长,像心脏泵血。实体识别负责结构化,像骨架撑起身体。数据处理流程负责质量控制,像免疫系统清除坏细胞。定时任务负责持续运行,像呼吸一样不停。系统从工具集合转变为完整体系。AI具备明确行为模式,可以独立完成知识管理任务。你明天去度假,系统自己在家转得飞起。你回来问“这几天有什么新东西?”,系统说“你不在的这几天,来了37封邮件,我帮你整理了12个新实体,修复了8个错误连接,你要看报告吗?” 你当场想给它发年终奖。
分层结构如何实现不同类型信息协同工作
系统将信息分为不同层级。长期知识层负责存储世界信息,包括人物、组织、事件与概念。你记的“张三在云图科技”“边缘计算定义”“2026年4月13日评审会”全部堆在这一层。操作层负责存储行为规则与决策逻辑。你定义的“每次回答前必须读库”“冲突时取最新时间戳”放在这一层。当前上下文层负责处理即时对话。你跟AI说“今天心情不好”,AI把这句话临时记在这一层,聊完可能就扔。
不同层级承担不同职责。长期层提供事实基础,像图书馆的藏书。操作层提供行为指导,像图书馆的管理员手册。即时层提供当前语境,像你进图书馆时跟管理员说的“我今天想找关于狗的书”。三者共同参与决策过程。你问“二狗掉毛怎么办”,即时层记录“用户问掉毛”,操作层调取规则“优先从长期层检索相关实体”,长期层返回“二狗、柯基、无线吸尘器、你妈讨厌狗毛”。系统在运行时同时访问三层信息。输出结果基于完整数据结构,而不是单一来源。AI不会只看长期层忽略你刚说的“今天心情不好”,也不会只看即时层忘了二狗是谁。
这种分层设计避免信息混乱。不同类型数据各自独立,同时保持协同。长期层不会因为你今天心情不好就把二狗删了。即时层不会因为你昨天记了“二狗掉毛”就永远占着内存不释放。三层各干各的活,又配合得像一支乐队。鼓手打长期层的稳定节奏,贝斯手弹操作层的固定低音,主唱唱即时层的即兴旋律。你听到的是一首完整的歌,不是噪音。
GBrain 和 OpenClaw/Hermes 的关系
- GBrain 负责“你知道什么”——比如谁是谁、哪个公司、谈了什么买卖、开了什么会、有什么想法概念、或者你原创的思考。它就像你的长期记忆,存着你对这个世界的认知。
- OpenClaw 的 Agent 记忆(memory_search) 负责“它该怎么干活”——比如偏好、做过的决定、当前会话的上下文、这个 Agent 应该用什么方式行事。
它们是互补的,分工如下:
- GBrain 层:存的是人、公司、会议、想法、媒体等。查它就用 gbrain search、gbrain query、gbrain get。
- Agent 记忆层:存的是偏好、决策、运行配置。查它就用 memory_search。
- 会话上下文层:存的是当前这次对话的内容。这个一般是自动的。
实际用的时候,三层都要查:
- 查世界里的客观事实 → 用 GBrain
- 查 Agent 的配置和偏好 → 用 Agent 记忆
- 查当前聊到哪了 → 用会话上下文
安装方式:执行 openclaw skills install gbrain。
总结
GBrain通过读写循环、结构化知识与混合检索,让AI从无记忆工具进化为可持续成长的认知系统,实现知识的时间复利积累。
gbrain 0.8.0版本
gbrain这次更新到0.8.0版本后,你的AI助手(openclaw/hermes)就能接电话了。打开浏览器就能用,只需要一个OpenAI的账号,Twilio的电话号码是可选的(不配也能用)。
之前,gbrain像个闷葫芦——能存东西、搜索、查资料,就是不会说话。
现在:
→ 升级到0.8.0后,AI自己会主动问你要不要开通语音功能
用的是WebRTC技术,完全不用配置,上手就能用。然后它会问你电话号码。以后每次升级,新功能都会这么主动推销自己。
→ AI会自己取名字、定性格
它不会冷冰冰地说"请问有什么可以帮您",而是会直接来一句"兄弟,今天你的社交雷达发现了点猛料",因为内置了"互动热情度"的预判机制。
→ 内置25个实用功能模板
包括:以对话背景为先的提示词、主动提建议的模式、来电转接、卡住时自动恢复、调用工具时发出"思考中"的声音、降噪、提示词压缩(从1.3万个字符压缩到4700个)。
说不定我真会让它给我妈打个电话——她终于有个能听她说话的人了。