Omnigent 可以让你:
- 使用任何设备(包括手机)与代理协作。会话始终跟随您:在终端开始,在浏览器中继续,或在手机上继续。消息、子代理、终端和文件始终保持同步。
- 管理多个智能体。在同一会话中同时使用 Claude Code、Codex、Pi 和自定义智能体(在 YAML 中定义)。让一个智能体审查另一个智能体的工作,或者将任务分配给擅长不同任务的智能体。
- 可使用任何模型。可以是官方 API 密钥、Claude/ChatGPT 订阅,或任何兼容的网关。全部都是一流的。
- 协作。共享会话,以便队友可以与您的代理聊天并实时观看其运行情况,在您的计算机上共同操作,或者创建对话分支以便他们自己继续进行。
- ☁️ 在云沙箱中运行代理。无需笔记本电脑:在一次性Modal或Daytona 沙箱中运行会话,可通过 CLI 启动,或由服务器为每个会话单独配置(托管主机)。更多服务提供商即将加入。
- ️ 管理您的客服人员。您可以创建 策略,在执行风险操作前暂停操作并等待您的批准,限制消费金额,或限制客服人员可使用的工具。这些策略可以应用于整个服务器、单个客服人员或单个聊天窗口。
现在AI编程工具一大堆,但各干各的。就像厨房里有菜刀、削皮器、搅拌机,但没人规定谁先干啥,最后菜切好了锅还没热。Omnigent这个项目干的事,就是给这群工具定规矩,让它们像一支球队一样配合,同时还要管住它们别乱来。
搞AI工具协作这件事,必须先把“单打独斗”的毛病改了
现在的AI编程工具太多了。Claude Code会写代码,OpenAI Codex也会写,OpenCode还能干别的。每个单独拎出来都挺厉害,但放到一起就乱套。
你想想,一个团队里每个人都觉得自己是老大,想干嘛干嘛,那结果就是谁都不听谁的。写代码的刚改完一个函数,测试的跑了一遍说有问题,重构的又改了一遍,最后三个人改的是同一个地方,但谁也不知道别人干了啥。
Omnigent想解决的就是这个问题。它不创造新的AI模型,而是在这群工具上面加一个“总调度室”。这个总调度室负责发任务、定规矩、管边界。谁该干啥、能干啥、不能干啥,都写得明明白白。
这样做的好处很明显。你不用纠结哪个工具最强,只需要知道哪个工具最适合眼前的这个小活。就像搬家,搬冰箱要找力气大的,装箱子要找手巧的,每个人干自己擅长的部分,整体效率才最高。
这个总调度室的存在,把“一堆工具”变成了“一个系统”。原来每个工具都是独立的小岛,现在它们之间有桥了,有路了,能互相看见互相配合了。
多工具一起干活,得有人分角色才行
单代理的思路很简单,就是一个任务交给一个模型,干完拉倒。但现实里的任务,尤其是写代码这种活,根本不是一条线能搞定的。
你想啊,写一个功能,有人要设计整体架构,有人要写具体代码,有人要跑测试找bug,还有人要写文档说明怎么用。这些事情是同时发生的,不是等一个干完再干下一个。
Omnigent的搞法就是“代理群”。它把不同的角色分给不同的工具。一个专门写代码,一个专门检查逻辑对不对,一个专门跑测试,一个专门整理输出格式。
这些角色不绑死在某个模型上。今天Claude Code写代码写得好,就让Claude Code上。明天OpenAI Codex在某些任务上表现更好,那就换它上。调度层只关心一件事:谁最适合干眼下这个活。
这个设计很有意思。它不迷信任何单一模型,而是相信“组合的力量”。就像一支足球队,前锋射门准就当前锋,后卫防守稳就当后卫,你不会让守门员去踢前锋。
这样一来,AI就不是“一个大脑在算”,而是“好多节点在联网工作”。每个节点干自己最擅长的,整体上就能处理更复杂的任务。
所有工具必须共享同一个记忆,不然就是各说各话
在真正的开发里,最让人头疼的问题不是模型不够聪明,而是上下文断了。你在Claude Code里跟它聊了半天,换到OpenAI Codex的时候,它啥也不知道,你又得重新说一遍。
这就好比你跟同事A说完需求,转头跟同事B说的时候,同事B问你“啥需求?”,你只能再说一遍。说完了同事A又跑来问你“你刚才说的那个点要不要改?”,你整个人都要炸了。
Omnigent搞了一个统一会话系统。它把命令行、网页界面、Slack、微软Teams全都接到同一个状态空间里。Slack和Teams在这里不是聊天工具,而是任务的入口和出口。
你可以在命令行里启动一个任务,然后在网页上盯着它跑得怎么样,中途在Slack里插一句话说“这个函数名改一下”,最后在Teams里等领导审批通过。所有这些操作,都写在同一个“会话状态层”里。
工具之间再也不需要复制粘贴传话了。大家都是直接读同一份上下文,你改了啥我马上知道,我说了啥你也能看到。
这解决了一个关键问题:AI协作的碎片化。原来每个工具就像碎了一地的玻璃渣,现在它们被拼回一整块玻璃了。
管不住AI的权限,再强的系统也是定时炸弹
多个AI工具一起干活,最怕的不是它们能力不够,而是它们失控。你想啊,每个工具都能执行命令、读写文件、甚至部署代码。要是没有约束,一个工具写错了,另一个工具接着错上加错,最后整个项目就炸了。
Omnigent的精细安全模型,说白了就是给每个AI画一个“活动范围”。你能动哪些文件、能执行什么命令、能改哪块代码、能调用哪些工具、能输出啥内容,全都写得清清楚楚。
它不是简单地允许或禁止,而是分层授权。比如说,一个代理可以读代码但不能部署到服务器,另一个代理可以改函数但不能碰生产环境的数据。
这个思路很像公司的权限系统。普通员工能看自己的工资条,但不能改别人的。经理能审批请假,但不能随便发钱。每个角色都有明确的边界。
在多代理系统里,这个安全模型不是附加功能,而是核心结构。没有它,代理越多风险越大。有了它,就算某个代理犯错了,也不会把整个系统带沟里去。就像电路里的保险丝,哪路短路了就断哪路,不影响别的。
AI从“调用工具”变成“编排流程”,这才是质变
当你有多个工具、多个会话、多层权限的时候,整个系统已经不是在“调用工具”了,而是在“编排流程”。
Omnigent的关键变化就在这里。一个任务不是由一个模型从头干到尾,而是由一个流程图来驱动。每一步走到哪、谁来干、干完交给谁,都是设计好的。
举个例子。一个典型的流程可能是这样的:有人在Slack里发了一个任务,系统在命令行里启动一个代理,这个代理叫OpenAI Codex生成代码,生成的代码交给Claude Code去重构,重构完了交给OpenCode去测试,测试通过后在Teams里等人审批,审批完了输出到网页上给你看结果。
每一步都不是孤立的,而是受控流转。就像工厂里的流水线,零件从这道工序走到下道工序,每一步都有质检,不会乱跑。
这种结构让AI系统更像CI/CD流水线,而不是聊天机器人。CI/CD流水线你知道吧,就是代码提交之后自动跑测试、自动打包、自动部署的那套东西。现在AI的协作也变成这样了,自动化、可追踪、可控制。
统一上下文比模型能力重要得多,别搞反了
很多人一听说多工具协作,第一反应就是“那我得找个最强的模型来当老大”。这是个误区。
实际上的瓶颈根本不是模型强不强,而是大家的上下文是不是一致的。你想啊,Claude Code和OpenAI Codex同时改同一段代码,一个改成这样,一个改成那样,要是没有统一的状态层,你根本不知道哪个是最终版本。
Omnigent用共享会话层解决了这个问题。所有修改都基于同一个状态树。不管谁来改、什么时候改、改了多少次,大家看到的都是同一份东西。
系统再也不需要问“谁是最新的”,只需要问“谁在同一个状态空间里”。这就好比你们团队都用同一个在线文档,谁改了啥立刻同步,不会出现你改完我改完最后不知道谁改完的情况。
这个机制减少了信息漂移。信息漂移就是你跟A说了一个事,A跟B说的时候变了一点,B跟C说的时候又变了一点,最后传到Z那里已经完全变味了。统一上下文直接堵死了这条路。
它也降低了重复生成。原来工具A干了一遍活,工具B不知道,又干了一遍,浪费算力也浪费时间。现在大家都看到同一个状态,干过了就不干了。
系统越复杂就越需要约束,这是个铁律
AI系统越复杂,越容易出现你想不到的行为。多代理系统尤其明显,因为每个代理都是独立的“小脑瓜子”,它只盯着自己那点局部任务,但它不知道全局在干啥。
这就是局部最优导致全局错误。好比一个快递员为了省自己那点路,选了条近道,结果把整个配送中心的路线都搞乱了。
Omnigent的安全模型不是后来补上去的,而是从一开始就当核心来设计的。它用权限分层和操作隔离,把风险关在小笼子里。
什么叫操作隔离?就是你出错了只影响你自己,不影响别人。一个代理写了个死循环,最多它自己卡住,别的代理该干嘛还干嘛。一个代理误删了某个文件,也只能删它权限范围内的,删不了系统文件。
这种设计就像电路里的保险丝,哪路电流过大了就烧哪路的保险丝,别的路照样通电。系统在异常的时候能自动切断风险路径,不会一波带走全部。
越强的系统越需要这种约束。就像核电站,发电能力超强,但安全壳也超级厚。你不会因为想要更多电就把安全壳拆了。
AI系统开始像公司一样运转,有沟通有审批有执行
当Slack、Teams、命令行、网页界面全都接入同一个系统之后,这个框架就已经不只是开发工具了,它更像一个公司。
Slack负责沟通入口,大家可以在里面发任务、讨论问题。微软Teams负责审批流程,重要的变更需要领导点一下同意。命令行负责执行层,那些需要精确控制的操作在终端里干。网页界面负责可视化,你可以看到整个流程跑得怎么样。
Omnigent在中间充当的是“组织调度层”。它把沟通、审批、执行、展示这些功能串在一起,让它们配合起来。
这让AI系统具备了一些公司才有的特征。任务分发就像老板给员工派活,权限管理就像部门墙,执行反馈就像日报周报,结果审核就像质检。
工具不再只是工具,它们变成了组织里的角色节点。有的工具负责“动嘴”,有的负责“动手”,有的负责“把关”。每一个都知道自己在这个组织里是干啥的。
这个变化挺有意思的。原来我们说AI是工具,是说它像锤子螺丝刀一样被我们拿着用。现在AI变成了组织里的成员,它们之间互相配合,我们只需要在这个组织上面做管理和调度。
AI开发的重心正在从“造模型”变成“搭系统”
过去大家聊AI开发,聊的都是模型有多大、参数有多少、训练数据用了多少、推理速度有多快。这些当然重要,但Omnigent这类框架告诉我们另一条路:系统设计可能比模型本身还重要。
Omnigent的价值不在于它能生成多牛的代码,而在于它能把好几个生成代码的能力组织成一个稳定的系统。它回答的是一个更工程化的问题:当AI工具足够多的时候,怎么让它们不互相打架,而是老老实实配合着把活干完。
这个转变意味着AI开发的核心正在从“训练模型”转向“设计协作结构”。原来你是花几个月训练一个大模型,现在你是花几天把已有的几个模型接在一起。原来你追求单个模型的极限能力,现在你追求多个模型的整体效率。
你可以这么理解。单模型像是一个全能选手,啥都会一点但都不精。多模型协作像是一支专业团队,有人专门写代码,有人专门测试,有人专门部署,每个人都是顶尖的,配合起来无敌。
哪一种更接近真实世界的开发?显然是后者。真实世界里没有一个人能搞定所有事,但一个配合默契的团队可以搞定任何事。
AI开发走到今天这一步,模型能力已经够用了,真正的瓶颈变成了怎么让它们一起干活不打架。Omnigent给出的答案很清晰:统一调度、统一上下文、精细权限、流程编排。把这四件事做好,AI就能从单点工具变成可控协作系统。
总结
Omnigent通过在多个AI编码工具之上构建统一调度层,实现了Claude Code、OpenAI Codex、OpenCode等工具的协同工作。核心机制包括多代理角色分工、统一会话状态共享、精细权限分层控制,以及流程图驱动的任务编排。
这种设计将AI从孤立的单点工具转变为类似组织结构的可控协作系统,标志着AI开发重心正从模型能力转向系统架构。