OpenClaw + Antfarm 多智能体工作流实战


Antfarm让你用一条命令在OpenClaw中部署完整AI工程团队,通过确定性工作流实现从需求到PR的全自动交付,无需Docker或Redis,基于YAML配置和Ralph循环架构,让代码在睡觉时自动写完。

你再也不用花五万块招一个初级开发团队了,现在只需要对着你的龙虾(OpenClaw的吉祥物)说一句"安装蚂蚁农场",瞬间就能召唤出一支由七个AI代理组成的完整工程团队,从需求分析到代码审查全自动跑通,而且全程不需要装什么Docker容器、Redis缓存或者Kafka消息队列这种重家伙,就用一个纯文本的配置文件加上系统自带的定时任务,让你的电脑在睡觉的时候也能自动写代码、修Bug、做安全审计,醒来就能看到已经测试通过的合并请求躺在GitHub里等你点一下确认。

作者背景介绍

瑞安·卡森(Ryan Carson)是个在硅谷摸爬滚打二十年的老江湖,从科罗拉多大学计算机系毕业后跑去英国当过程序员,后来创办过三家成功的科技公司全都卖掉了,其中最有名的是在线编程学校Treehouse,巅峰时期团队上百人,教过超过一百万学生写代码,拿过两千万美元的风投,还拿过年度企业家大奖。

这老哥现在全身心扑在AI编程工具上,先是搞出了Ralph这个让AI自动循环写代码的神器,在GitHub上拿了将近一万颗星星,又在X平台上被一百八十万人围观学习,现在更是推出了Antfarm这个多智能体协作框架,直接把单兵作战的AI升级成了整建制开发团队。

他的独特之处在于既懂技术底层又懂产品管理,能把复杂的软件工程流程拆解成中学生都能看懂的步骤,而且特别擅长用极简的架构解决复杂问题,比如Antfarm整个系统就只用YAML配置文件、SQLite数据库和系统自带的cron定时任务三样东西,拒绝一切过度工程化。

为什么你的龙虾需要一个蚂蚁农场

想象一下这个场景:你有一个绝妙的创业点子,想要加一个用户登录功能,传统的做法是你得先写需求文档,然后自己吭哧吭哧写代码,写完还要测一遍,最后提交到GitHub。

如果你用普通的AI编程助手,可能稍微快一点,但你得一直盯着它,生怕它搞出什么幺蛾子。而现在有了Antfarm,你只需要对你的OpenClaw龙虾说一句"给我跑一个功能开发流程,任务是用OAuth做用户认证",然后你就可以去睡觉了。

等你醒来,你会发现一个完整的开发团队已经替你干完了所有活:规划师先把大任务拆成了七个小故事,搭建专员准备好了开发环境,程序员写完了代码,验证员检查每个故事是否符合验收标准,测试员跑完了所有测试,最后还有一个专门的审查员盯着代码质量。

这七个代理像流水线工人一样各司其职,而且每个步骤都是确定性的,绝对不会出现" hopefully the agent remembers to test"这种靠运气的情况。

三大开箱即用的黄金工作流

Antfarm自带三个经过实战检验的工作流模板,每一个都是针对软件开发中最常见的痛点设计的。

第一个叫功能开发(feature-dev),整整七个代理组成豪华阵容:规划师负责把模糊的需求拆成具体的用户故事,搭建专员准备开发环境,程序员动手实现,验证员检查每个故事是否达标,测试员跑测试,PR专员提交合并请求,审查员做最后的代码审查。整个流程是规划、搭建、实现、验证、测试、提PR、审查,七步走下来,一个功能就稳稳当当地进了代码库。

第二个是安全审计(security-audit),也是七个代理,专门帮你找代码里的漏洞:扫描员先全面扫描,优先级排序员按严重程度分级,搭建专员准备环境,修复专员打补丁,验证员确认修复有效,测试员跑回归测试,最后提PR。

第三个是Bug修复(bug-fix),六个代理组成快速反应部队:分类员先复现Bug,调查员找根因,搭建专员准备环境,修复专员打补丁,验证员确认解决,最后提PR。

这三个工作流覆盖了软件开发的全生命周期,从开发新功能到维护旧代码再到安全保障,全方位无死角。

确定性工作流:告别AI的"随性发挥"

以前用AI编程最头疼的就是不确定性,同样的提示词每次出来的结果都不一样,有时候它会记得写测试,有时候就忘了,有时候它会主动做代码审查,有时候就直接提交了。

Antfarm彻底解决了这个问题,它用YAML文件把每个步骤都定义得死死的,代理必须严格按照规定的顺序执行,第一步永远是规划,规划完了才能搭建环境,环境好了才能写代码,代码写完了必须验证,验证通过了才能测试,测试全绿了才能提PR,提了PR还必须有人审查。

这种确定性不是靠AI自觉,而是靠架构保证的:每个代理都是独立的,它们通过SQLite数据库协调工作,一个步骤做完了才会把状态更新到数据库,下一个代理看到状态变了才会开始干活。而且每个代理用的都是全新的上下文,绝对不会出现"前面聊了五十轮天导致后面开始胡说八道"的情况,这就保证了每次执行都是干净利落的。

代理互查:自己人不骗自己人

Antfarm最聪明的设计就是让代理互相监督,而不是自己给自己打分。程序员写完了代码,不能自己说"我觉得挺好的",必须交给专门的验证员去检查,验证员会拿着需求文档里的验收标准一条条对,看这个功能是不是真的实现了该实现的东西。

这种设计避免了"运动员兼裁判员"的弊端,因为AI有时候也会偷懒,如果让它自己检查自己的代码,它可能会 overlooking 一些明显的问题。

但在Antfarm里,验证员是个独立的代理,它和程序员用的是不同的系统提示词,看问题的角度也不一样,更容易发现潜在的问题。而且如果验证不通过,整个流程会暂停,要么自动重试,要么升级给人类处理,绝对不会让有问题的代码蒙混过关。

新鲜上下文:每次开工都是满血状态

用过AI编程助手的人都知道,上下文窗口是个让人又爱又恨的东西。聊得多了,AI就开始健忘,前面说的要求后面就忘了,有时候还会产生幻觉,编造一些不存在的状态。

Antfarm用了一个叫"Ralph循环"的技巧来解决这个问题:每个代理每次只干一个步骤,干完了就退出,下一个步骤启动一个全新的AI实例,这个实例只读取当前需要的信息,不会带着之前五十轮对话的包袱。

所有的记忆都通过文件系统来持久化:Git提交历史记录了代码变更,progress.txt文件记录了学习心得,prd.json文件记录了任务状态。这样每个代理开工的时候都是轻装上阵,带着最精准的信息做最专注的事情,效率和质量都比长会话模式高得多。

一键安装:告别基础设施噩梦

传统的多智能体系统动不动就要装Docker、配Redis、搭Kafka,光是环境配置就能折腾一整天。Antfarm走了一条完全不同的路,它就是一个TypeScript写的命令行工具,零外部依赖,只要你的电脑上能跑OpenClaw,就能跑Antfarm。

安装过程简单到令人发指:对着你的龙虾说一句"install github.com/snarktank/antfarm",一切就自动搞定了。

它会自动创建所有代理的工作空间,配置好定时任务,设置好子代理权限,连数据库都是自动初始化的。你不需要懂什么容器编排,不需要配什么消息队列,甚至不需要知道SQLite是什么,一切都封装好了,开箱即用。

实战演示:从安装到跑通全流程

让我们看一个真实的操作示例。首先安装功能开发工作流:

antfarm workflow install feature-dev

看到绿色的对勾提示"Installed workflow: feature-dev"就说明装好了。然后启动一个任务:

antfarm workflow run feature-dev "Add user authentication with OAuth"

系统会返回一个运行ID,比如a1fdf573,然后你就可以去睡觉了。如果你想看看进度,随时查状态:

antfarm workflow status "OAuth"

你会看到一张清晰的进度表:规划步骤已经完成,搭建步骤已经完成,实现步骤正在运行中,已经完成了七个故事里的三个,验证、测试、提PR、审查这些步骤还在排队等待。每个步骤后面都标注了负责的代理角色,一目了然。如果某个步骤失败了,系统会自动重试,重试次数用完了就会通知你,绝对不会悄无声息地挂掉。

自定义你的工作流:YAML配置的艺术

Antfarm的强大之处不仅在于开箱即用,更在于完全可定制。所有的工作流都是用YAML文件定义的,语法简单到初中生都能看懂。你可以定义自己的代理,给它起名字、写人设、指定工作空间,还可以定义步骤的顺序、每个步骤的输入输出、重试逻辑、验收标准。比如你想加一个研究步骤,只需要几行配置:

id: research
agent: researcher
input: |
  Research {{task}} and report findings.
  Reply with STATUS: done and FINDINGS: ...
expects: "STATUS: done"

这里的{{task}}是一个变量,会被替换成实际的任务描述,expects字段定义了完成标准,代理必须返回包含"STATUS: done"的文本才算完成。这种设计让工作流的逻辑完全透明,你可以清楚地知道每个代理会做什么、怎么做、什么时候算做完,没有任何黑箱操作。

安全至上:四层防护罩守护你的代码

因为Antfarm的代理会在你的电脑上运行代码,安全问题被放在了首位。第一层防护是代码来源控制,Antfarm只能从官方的snarktank/antfarm仓库安装工作流,绝对不能从随便哪个网址下载不明代码。第二层是人工审查,每个工作流在合并进仓库之前都要经过严格的审查,专门检查有没有提示词注入攻击和恶意代理文件。第三层是透明化,所有的工作流都是纯文本的YAML和Markdown,你可以在安装之前逐行阅读,清楚地知道每个代理会执行什么操作。第四层是社区监督,任何人都可以提交新的工作流,但都必须经过安全审查才能上线,这种众包审查机制让漏洞更容易被发现和修复。

实时监控:Web仪表盘让一切可视化

虽然Antfarm可以在后台全自动运行,但它也提供了一个漂亮的Web仪表盘让你随时查看状态。只需要运行:

antfarm dashboard

然后在浏览器里打开3333端口,你就能看到所有正在运行的工作流、每个步骤的进度、各个代理的输出日志。你可以点进具体的任务,看到详细的用户故事列表,每个故事的验收标准,以及当前的完成情况。这种可视化让全自动的工作流变得透明可控,你既可以完全放手让AI自己干,也可以随时介入查看细节。

完整命令手册:从生到死的全生命周期管理

Antfarm提供了一整套命令来管理工作流的全生命周期。

安装阶段可以用antfarm install一键安装所有内置工作流,也可以用antfarm workflow install 单独安装某一个。

运行阶段用antfarm workflow run 启动任务,用antfarm workflow status 查状态,用antfarm workflow runs列出所有历史运行。

如果某个运行失败了,可以用antfarm workflow resume 恢复执行。

管理阶段可以用antfarm workflow list查看有哪些可用工作流,用antfarm workflow uninstall 删除不需要的。

如果想彻底清理,用antfarm uninstall可以删掉所有代理、定时任务和数据库。

日常监控除了仪表盘,还可以用antfarm logs查看最近的日志。

站在Ralph的肩膀上:从单兵到团队的进化

Antfarm不是凭空出现的,它建立在Ralph这个已经验证过的模式之上。

Ralph的核心思想很简单:用一个bash循环不断重启AI代理,每次都用全新的上下文,通过文件系统来持久化记忆。

这个模式最早由杰弗里·亨特利(Geoffrey Huntley)提出,命名来自《辛普森一家》里的拉尔夫·维古姆,就是那个 famously persistent 的小孩。瑞安·卡森把这个模式发扬光大,先做了Ralph的单代理版本,在GitHub上拿了九千八百颗星星,又在X平台上被一百八十万人围观学习。

现在Antfarm把Ralph从单兵作战升级成了团队协作,但核心哲学没变:新鲜上下文、文件持久化、确定性流程。

这种进化路径特别符合软件工程的发展规律,先解决单个开发者的问题,再解决团队协作的问题。

为什么现在正是时候:大模型能力跃迁的临界点

Antfarm的出现时机绝非偶然,它踩在了大模型能力跃迁的关键节点上。早几年模型还不够聪明,必须用很紧的护栏(guardrails)框住它,每一步都要人工检查,不然就会跑偏。但现在随着Opus 4.5和Gemini 3这些新一代模型的发布,AI终于聪明到可以"mostly autonomous"了,大部分情况下都能自主决策,不需要人类一直盯着。

这种能力跃迁让多智能体协作从理论变成了实践,因为代理之间可以可靠地交接任务,而不是每一步都要人类介入救火。瑞安·卡森敏锐地捕捉到了这个转折点,把之前积累的Ralph经验升级成了Antfarm的团队协作框架,正好赶上了这波技术红利。


极简架构的哲学:拒绝过度工程化

Antfarm的架构设计体现了一种反潮流的极简主义。在这个动辄微服务、容器编排、事件驱动的时代,Antfarm选择了最古老的三大件:YAML配置文件、SQLite数据库、cron定时任务。

没有Redis,没有Kafka,没有Docker,没有Kubernetes,就是一个纯TypeScript写的命令行工具,零外部依赖。

这种极简带来了几个好处:
首先是部署简单,只要Node.js环境就能跑;其次是调试容易,出了问题看日志就能定位;
再次是理解成本低,任何人都能读懂YAML配置明白系统在干什么;
最后是维护轻松,不用担心哪个中间件版本不兼容。

这种"够用就好"的哲学特别适合个人开发者和小团队,不需要专门的运维人员,一个人就能搞定全部。