Omnigent开源框架解析：多智能体协作共享会话精细安全控制

#OpenClaw #AI智能体Agent #GitHub工具库推荐 #AI端侧

2026-06-15 1 6K banq

不妨了解一下 Omnigent，这是一个meta-harness开源框架，它允许您使用所有现有的Agent编程框架（Claude Code、Codex、OpenCode、pi），以多种方式（例如 Slack/Teams、cli、webui）进行协作和共享会话，同时具有精细的安全模型，可以真正加强对代理可以做什么/不可以做什么的控制。

Omnigent 可以让你：

使用任何设备（包括手机）与代理协作。会话始终跟随您：在终端开始，在浏览器中继续，或在手机上继续。消息、子代理、终端和文件始终保持同步。
管理多个智能体。在同一会话中同时使用 Claude Code、Codex、Pi 和自定义智能体（在 YAML 中定义）。让一个智能体审查另一个智能体的工作，或者将任务分配给擅长不同任务的智能体。
可使用任何模型。可以是官方 API 密钥、Claude/ChatGPT 订阅，或任何兼容的网关。全部都是一流的。
协作。共享会话，以便队友可以与您的代理聊天并实时观看其运行情况，在您的计算机上共同操作，或者创建对话分支以便他们自己继续进行。
☁️ 在云沙箱中运行代理。无需笔记本电脑：在一次性Modal或Daytona 沙箱中运行会话，可通过 CLI 启动，或由服务器为每个会话单独配置（托管主机）。更多服务提供商即将加入。
️ 管理您的客服人员。您可以创建策略，在执行风险操作前暂停操作并等待您的批准，限制消费金额，或限制客服人员可使用的工具。这些策略可以应用于整个服务器、单个客服人员或单个聊天窗口。

现在AI编程工具一大堆，但各干各的。就像厨房里有菜刀、削皮器、搅拌机，但没人规定谁先干啥，最后菜切好了锅还没热。Omnigent这个项目干的事，就是给这群工具定规矩，让它们像一支球队一样配合，同时还要管住它们别乱来。

搞AI工具协作这件事，必须先把“单打独斗”的毛病改了

现在的AI编程工具太多了。Claude Code会写代码，OpenAI Codex也会写，OpenCode还能干别的。每个单独拎出来都挺厉害，但放到一起就乱套。

你想想，一个团队里每个人都觉得自己是老大，想干嘛干嘛，那结果就是谁都不听谁的。写代码的刚改完一个函数，测试的跑了一遍说有问题，重构的又改了一遍，最后三个人改的是同一个地方，但谁也不知道别人干了啥。

Omnigent想解决的就是这个问题。它不创造新的AI模型，而是在这群工具上面加一个“总调度室”。这个总调度室负责发任务、定规矩、管边界。谁该干啥、能干啥、不能干啥，都写得明明白白。

这样做的好处很明显。你不用纠结哪个工具最强，只需要知道哪个工具最适合眼前的这个小活。就像搬家，搬冰箱要找力气大的，装箱子要找手巧的，每个人干自己擅长的部分，整体效率才最高。

这个总调度室的存在，把“一堆工具”变成了“一个系统”。原来每个工具都是独立的小岛，现在它们之间有桥了，有路了，能互相看见互相配合了。

多工具一起干活，得有人分角色才行

单代理的思路很简单，就是一个任务交给一个模型，干完拉倒。但现实里的任务，尤其是写代码这种活，根本不是一条线能搞定的。

你想啊，写一个功能，有人要设计整体架构，有人要写具体代码，有人要跑测试找bug，还有人要写文档说明怎么用。这些事情是同时发生的，不是等一个干完再干下一个。

Omnigent的搞法就是“代理群”。它把不同的角色分给不同的工具。一个专门写代码，一个专门检查逻辑对不对，一个专门跑测试，一个专门整理输出格式。

这些角色不绑死在某个模型上。今天Claude Code写代码写得好，就让Claude Code上。明天OpenAI Codex在某些任务上表现更好，那就换它上。调度层只关心一件事：谁最适合干眼下这个活。

这个设计很有意思。它不迷信任何单一模型，而是相信“组合的力量”。就像一支足球队，前锋射门准就当前锋，后卫防守稳就当后卫，你不会让守门员去踢前锋。

这样一来，AI就不是“一个大脑在算”，而是“好多节点在联网工作”。每个节点干自己最擅长的，整体上就能处理更复杂的任务。

所有工具必须共享同一个记忆，不然就是各说各话

在真正的开发里，最让人头疼的问题不是模型不够聪明，而是上下文断了。你在Claude Code里跟它聊了半天，换到OpenAI Codex的时候，它啥也不知道，你又得重新说一遍。

这就好比你跟同事A说完需求，转头跟同事B说的时候，同事B问你“啥需求？”，你只能再说一遍。说完了同事A又跑来问你“你刚才说的那个点要不要改？”，你整个人都要炸了。

Omnigent搞了一个统一会话系统。它把命令行、网页界面、Slack、微软Teams全都接到同一个状态空间里。Slack和Teams在这里不是聊天工具，而是任务的入口和出口。

你可以在命令行里启动一个任务，然后在网页上盯着它跑得怎么样，中途在Slack里插一句话说“这个函数名改一下”，最后在Teams里等领导审批通过。所有这些操作，都写在同一个“会话状态层”里。

工具之间再也不需要复制粘贴传话了。大家都是直接读同一份上下文，你改了啥我马上知道，我说了啥你也能看到。

这解决了一个关键问题：AI协作的碎片化。原来每个工具就像碎了一地的玻璃渣，现在它们被拼回一整块玻璃了。

管不住AI的权限，再强的系统也是定时炸弹

多个AI工具一起干活，最怕的不是它们能力不够，而是它们失控。你想啊，每个工具都能执行命令、读写文件、甚至部署代码。要是没有约束，一个工具写错了，另一个工具接着错上加错，最后整个项目就炸了。

Omnigent的精细安全模型，说白了就是给每个AI画一个“活动范围”。你能动哪些文件、能执行什么命令、能改哪块代码、能调用哪些工具、能输出啥内容，全都写得清清楚楚。

它不是简单地允许或禁止，而是分层授权。比如说，一个代理可以读代码但不能部署到服务器，另一个代理可以改函数但不能碰生产环境的数据。

这个思路很像公司的权限系统。普通员工能看自己的工资条，但不能改别人的。经理能审批请假，但不能随便发钱。每个角色都有明确的边界。

在多代理系统里，这个安全模型不是附加功能，而是核心结构。没有它，代理越多风险越大。有了它，就算某个代理犯错了，也不会把整个系统带沟里去。就像电路里的保险丝，哪路短路了就断哪路，不影响别的。

AI从“调用工具”变成“编排流程”，这才是质变

当你有多个工具、多个会话、多层权限的时候，整个系统已经不是在“调用工具”了，而是在“编排流程”。

Omnigent的关键变化就在这里。一个任务不是由一个模型从头干到尾，而是由一个流程图来驱动。每一步走到哪、谁来干、干完交给谁，都是设计好的。

举个例子。一个典型的流程可能是这样的：有人在Slack里发了一个任务，系统在命令行里启动一个代理，这个代理叫OpenAI Codex生成代码，生成的代码交给Claude Code去重构，重构完了交给OpenCode去测试，测试通过后在Teams里等人审批，审批完了输出到网页上给你看结果。

每一步都不是孤立的，而是受控流转。就像工厂里的流水线，零件从这道工序走到下道工序，每一步都有质检，不会乱跑。

这种结构让AI系统更像CI/CD流水线，而不是聊天机器人。CI/CD流水线你知道吧，就是代码提交之后自动跑测试、自动打包、自动部署的那套东西。现在AI的协作也变成这样了，自动化、可追踪、可控制。

统一上下文比模型能力重要得多，别搞反了

很多人一听说多工具协作，第一反应就是“那我得找个最强的模型来当老大”。这是个误区。

实际上的瓶颈根本不是模型强不强，而是大家的上下文是不是一致的。你想啊，Claude Code和OpenAI Codex同时改同一段代码，一个改成这样，一个改成那样，要是没有统一的状态层，你根本不知道哪个是最终版本。

Omnigent用共享会话层解决了这个问题。所有修改都基于同一个状态树。不管谁来改、什么时候改、改了多少次，大家看到的都是同一份东西。

系统再也不需要问“谁是最新的”，只需要问“谁在同一个状态空间里”。这就好比你们团队都用同一个在线文档，谁改了啥立刻同步，不会出现你改完我改完最后不知道谁改完的情况。

这个机制减少了信息漂移。信息漂移就是你跟A说了一个事，A跟B说的时候变了一点，B跟C说的时候又变了一点，最后传到Z那里已经完全变味了。统一上下文直接堵死了这条路。

它也降低了重复生成。原来工具A干了一遍活，工具B不知道，又干了一遍，浪费算力也浪费时间。现在大家都看到同一个状态，干过了就不干了。

系统越复杂就越需要约束，这是个铁律

AI系统越复杂，越容易出现你想不到的行为。多代理系统尤其明显，因为每个代理都是独立的“小脑瓜子”，它只盯着自己那点局部任务，但它不知道全局在干啥。

这就是局部最优导致全局错误。好比一个快递员为了省自己那点路，选了条近道，结果把整个配送中心的路线都搞乱了。

Omnigent的安全模型不是后来补上去的，而是从一开始就当核心来设计的。它用权限分层和操作隔离，把风险关在小笼子里。

什么叫操作隔离？就是你出错了只影响你自己，不影响别人。一个代理写了个死循环，最多它自己卡住，别的代理该干嘛还干嘛。一个代理误删了某个文件，也只能删它权限范围内的，删不了系统文件。

这种设计就像电路里的保险丝，哪路电流过大了就烧哪路的保险丝，别的路照样通电。系统在异常的时候能自动切断风险路径，不会一波带走全部。

越强的系统越需要这种约束。就像核电站，发电能力超强，但安全壳也超级厚。你不会因为想要更多电就把安全壳拆了。

AI系统开始像公司一样运转，有沟通有审批有执行

当Slack、Teams、命令行、网页界面全都接入同一个系统之后，这个框架就已经不只是开发工具了，它更像一个公司。

Slack负责沟通入口，大家可以在里面发任务、讨论问题。微软Teams负责审批流程，重要的变更需要领导点一下同意。命令行负责执行层，那些需要精确控制的操作在终端里干。网页界面负责可视化，你可以看到整个流程跑得怎么样。

Omnigent在中间充当的是“组织调度层”。它把沟通、审批、执行、展示这些功能串在一起，让它们配合起来。

这让AI系统具备了一些公司才有的特征。任务分发就像老板给员工派活，权限管理就像部门墙，执行反馈就像日报周报，结果审核就像质检。

工具不再只是工具，它们变成了组织里的角色节点。有的工具负责“动嘴”，有的负责“动手”，有的负责“把关”。每一个都知道自己在这个组织里是干啥的。

这个变化挺有意思的。原来我们说AI是工具，是说它像锤子螺丝刀一样被我们拿着用。现在AI变成了组织里的成员，它们之间互相配合，我们只需要在这个组织上面做管理和调度。

AI开发的重心正在从“造模型”变成“搭系统”

过去大家聊AI开发，聊的都是模型有多大、参数有多少、训练数据用了多少、推理速度有多快。这些当然重要，但Omnigent这类框架告诉我们另一条路：系统设计可能比模型本身还重要。

Omnigent的价值不在于它能生成多牛的代码，而在于它能把好几个生成代码的能力组织成一个稳定的系统。它回答的是一个更工程化的问题：当AI工具足够多的时候，怎么让它们不互相打架，而是老老实实配合着把活干完。

这个转变意味着AI开发的核心正在从“训练模型”转向“设计协作结构”。原来你是花几个月训练一个大模型，现在你是花几天把已有的几个模型接在一起。原来你追求单个模型的极限能力，现在你追求多个模型的整体效率。

你可以这么理解。单模型像是一个全能选手，啥都会一点但都不精。多模型协作像是一支专业团队，有人专门写代码，有人专门测试，有人专门部署，每个人都是顶尖的，配合起来无敌。

哪一种更接近真实世界的开发？显然是后者。真实世界里没有一个人能搞定所有事，但一个配合默契的团队可以搞定任何事。

AI开发走到今天这一步，模型能力已经够用了，真正的瓶颈变成了怎么让它们一起干活不打架。Omnigent给出的答案很清晰：统一调度、统一上下文、精细权限、流程编排。把这四件事做好，AI就能从单点工具变成可控协作系统。

总结

Omnigent通过在多个AI编码工具之上构建统一调度层，实现了Claude Code、OpenAI Codex、OpenCode等工具的协同工作。核心机制包括多代理角色分工、统一会话状态共享、精细权限分层控制，以及流程图驱动的任务编排。

这种设计将AI从孤立的单点工具转变为类似组织结构的可控协作系统，标志着AI开发重心正从模型能力转向系统架构。