Antfarm让你用一条命令在OpenClaw中部署完整AI工程团队,通过确定性工作流实现从需求到PR的全自动交付,无需Docker或Redis,基于YAML配置和Ralph循环架构,让代码在睡觉时自动写完。
你再也不用花五万块招一个初级开发团队了,现在只需要对着你的龙虾(OpenClaw的吉祥物)说一句"安装蚂蚁农场",瞬间就能召唤出一支由七个AI代理组成的完整工程团队,从需求分析到代码审查全自动跑通,而且全程不需要装什么Docker容器、Redis缓存或者Kafka消息队列这种重家伙,就用一个纯文本的配置文件加上系统自带的定时任务,让你的电脑在睡觉的时候也能自动写代码、修Bug、做安全审计,醒来就能看到已经测试通过的合并请求躺在GitHub里等你点一下确认。
作者背景介绍
瑞安·卡森(Ryan Carson)是个在硅谷摸爬滚打二十年的老江湖,从科罗拉多大学计算机系毕业后跑去英国当过程序员,后来创办过三家成功的科技公司全都卖掉了,其中最有名的是在线编程学校Treehouse,巅峰时期团队上百人,教过超过一百万学生写代码,拿过两千万美元的风投,还拿过年度企业家大奖。
这老哥现在全身心扑在AI编程工具上,先是搞出了Ralph这个让AI自动循环写代码的神器,在GitHub上拿了将近一万颗星星,又在X平台上被一百八十万人围观学习,现在更是推出了Antfarm这个多智能体协作框架,直接把单兵作战的AI升级成了整建制开发团队。
他的独特之处在于既懂技术底层又懂产品管理,能把复杂的软件工程流程拆解成中学生都能看懂的步骤,而且特别擅长用极简的架构解决复杂问题,比如Antfarm整个系统就只用YAML配置文件、SQLite数据库和系统自带的cron定时任务三样东西,拒绝一切过度工程化。
为什么你的龙虾需要一个蚂蚁农场
想象一下这个场景:你有一个绝妙的创业点子,想要加一个用户登录功能,传统的做法是你得先写需求文档,然后自己吭哧吭哧写代码,写完还要测一遍,最后提交到GitHub。
如果你用普通的AI编程助手,可能稍微快一点,但你得一直盯着它,生怕它搞出什么幺蛾子。而现在有了Antfarm,你只需要对你的OpenClaw龙虾说一句"给我跑一个功能开发流程,任务是用OAuth做用户认证",然后你就可以去睡觉了。
等你醒来,你会发现一个完整的开发团队已经替你干完了所有活:规划师先把大任务拆成了七个小故事,搭建专员准备好了开发环境,程序员写完了代码,验证员检查每个故事是否符合验收标准,测试员跑完了所有测试,最后还有一个专门的审查员盯着代码质量。
这七个代理像流水线工人一样各司其职,而且每个步骤都是确定性的,绝对不会出现" hopefully the agent remembers to test"这种靠运气的情况。
三大开箱即用的黄金工作流
Antfarm自带三个经过实战检验的工作流模板,每一个都是针对软件开发中最常见的痛点设计的。
第一个叫功能开发(feature-dev),整整七个代理组成豪华阵容:规划师负责把模糊的需求拆成具体的用户故事,搭建专员准备开发环境,程序员动手实现,验证员检查每个故事是否达标,测试员跑测试,PR专员提交合并请求,审查员做最后的代码审查。整个流程是规划、搭建、实现、验证、测试、提PR、审查,七步走下来,一个功能就稳稳当当地进了代码库。
第二个是安全审计(security-audit),也是七个代理,专门帮你找代码里的漏洞:扫描员先全面扫描,优先级排序员按严重程度分级,搭建专员准备环境,修复专员打补丁,验证员确认修复有效,测试员跑回归测试,最后提PR。
第三个是Bug修复(bug-fix),六个代理组成快速反应部队:分类员先复现Bug,调查员找根因,搭建专员准备环境,修复专员打补丁,验证员确认解决,最后提PR。
这三个工作流覆盖了软件开发的全生命周期,从开发新功能到维护旧代码再到安全保障,全方位无死角。
确定性工作流:告别AI的"随性发挥"
以前用AI编程最头疼的就是不确定性,同样的提示词每次出来的结果都不一样,有时候它会记得写测试,有时候就忘了,有时候它会主动做代码审查,有时候就直接提交了。
Antfarm彻底解决了这个问题,它用YAML文件把每个步骤都定义得死死的,代理必须严格按照规定的顺序执行,第一步永远是规划,规划完了才能搭建环境,环境好了才能写代码,代码写完了必须验证,验证通过了才能测试,测试全绿了才能提PR,提了PR还必须有人审查。
这种确定性不是靠AI自觉,而是靠架构保证的:每个代理都是独立的,它们通过SQLite数据库协调工作,一个步骤做完了才会把状态更新到数据库,下一个代理看到状态变了才会开始干活。而且每个代理用的都是全新的上下文,绝对不会出现"前面聊了五十轮天导致后面开始胡说八道"的情况,这就保证了每次执行都是干净利落的。
代理互查:自己人不骗自己人
Antfarm最聪明的设计就是让代理互相监督,而不是自己给自己打分。程序员写完了代码,不能自己说"我觉得挺好的",必须交给专门的验证员去检查,验证员会拿着需求文档里的验收标准一条条对,看这个功能是不是真的实现了该实现的东西。
这种设计避免了"运动员兼裁判员"的弊端,因为AI有时候也会偷懒,如果让它自己检查自己的代码,它可能会 overlooking 一些明显的问题。
但在Antfarm里,验证员是个独立的代理,它和程序员用的是不同的系统提示词,看问题的角度也不一样,更容易发现潜在的问题。而且如果验证不通过,整个流程会暂停,要么自动重试,要么升级给人类处理,绝对不会让有问题的代码蒙混过关。
新鲜上下文:每次开工都是满血状态
用过AI编程助手的人都知道,上下文窗口是个让人又爱又恨的东西。聊得多了,AI就开始健忘,前面说的要求后面就忘了,有时候还会产生幻觉,编造一些不存在的状态。
Antfarm用了一个叫"Ralph循环"的技巧来解决这个问题:每个代理每次只干一个步骤,干完了就退出,下一个步骤启动一个全新的AI实例,这个实例只读取当前需要的信息,不会带着之前五十轮对话的包袱。
所有的记忆都通过文件系统来持久化:Git提交历史记录了代码变更,progress.txt文件记录了学习心得,prd.json文件记录了任务状态。这样每个代理开工的时候都是轻装上阵,带着最精准的信息做最专注的事情,效率和质量都比长会话模式高得多。
一键安装:告别基础设施噩梦
传统的多智能体系统动不动就要装Docker、配Redis、搭Kafka,光是环境配置就能折腾一整天。Antfarm走了一条完全不同的路,它就是一个TypeScript写的命令行工具,零外部依赖,只要你的电脑上能跑OpenClaw,就能跑Antfarm。
安装过程简单到令人发指:对着你的龙虾说一句"install github.com/snarktank/antfarm",一切就自动搞定了。
它会自动创建所有代理的工作空间,配置好定时任务,设置好子代理权限,连数据库都是自动初始化的。你不需要懂什么容器编排,不需要配什么消息队列,甚至不需要知道SQLite是什么,一切都封装好了,开箱即用。
实战演示:从安装到跑通全流程
让我们看一个真实的操作示例。首先安装功能开发工作流:
antfarm workflow install feature-dev
看到绿色的对勾提示"Installed workflow: feature-dev"就说明装好了。然后启动一个任务:
antfarm workflow run feature-dev "Add user authentication with OAuth"
系统会返回一个运行ID,比如a1fdf573,然后你就可以去睡觉了。如果你想看看进度,随时查状态:
antfarm workflow status "OAuth"
你会看到一张清晰的进度表:规划步骤已经完成,搭建步骤已经完成,实现步骤正在运行中,已经完成了七个故事里的三个,验证、测试、提PR、审查这些步骤还在排队等待。每个步骤后面都标注了负责的代理角色,一目了然。如果某个步骤失败了,系统会自动重试,重试次数用完了就会通知你,绝对不会悄无声息地挂掉。
自定义你的工作流:YAML配置的艺术
Antfarm的强大之处不仅在于开箱即用,更在于完全可定制。所有的工作流都是用YAML文件定义的,语法简单到初中生都能看懂。你可以定义自己的代理,给它起名字、写人设、指定工作空间,还可以定义步骤的顺序、每个步骤的输入输出、重试逻辑、验收标准。比如你想加一个研究步骤,只需要几行配置:
id: research |
这里的{{task}}是一个变量,会被替换成实际的任务描述,expects字段定义了完成标准,代理必须返回包含"STATUS: done"的文本才算完成。这种设计让工作流的逻辑完全透明,你可以清楚地知道每个代理会做什么、怎么做、什么时候算做完,没有任何黑箱操作。
安全至上:四层防护罩守护你的代码
因为Antfarm的代理会在你的电脑上运行代码,安全问题被放在了首位。第一层防护是代码来源控制,Antfarm只能从官方的snarktank/antfarm仓库安装工作流,绝对不能从随便哪个网址下载不明代码。第二层是人工审查,每个工作流在合并进仓库之前都要经过严格的审查,专门检查有没有提示词注入攻击和恶意代理文件。第三层是透明化,所有的工作流都是纯文本的YAML和Markdown,你可以在安装之前逐行阅读,清楚地知道每个代理会执行什么操作。第四层是社区监督,任何人都可以提交新的工作流,但都必须经过安全审查才能上线,这种众包审查机制让漏洞更容易被发现和修复。
实时监控:Web仪表盘让一切可视化
虽然Antfarm可以在后台全自动运行,但它也提供了一个漂亮的Web仪表盘让你随时查看状态。只需要运行:
antfarm dashboard
然后在浏览器里打开3333端口,你就能看到所有正在运行的工作流、每个步骤的进度、各个代理的输出日志。你可以点进具体的任务,看到详细的用户故事列表,每个故事的验收标准,以及当前的完成情况。这种可视化让全自动的工作流变得透明可控,你既可以完全放手让AI自己干,也可以随时介入查看细节。
完整命令手册:从生到死的全生命周期管理
Antfarm提供了一整套命令来管理工作流的全生命周期。
安装阶段可以用antfarm install一键安装所有内置工作流,也可以用antfarm workflow install
运行阶段用antfarm workflow run
如果某个运行失败了,可以用antfarm workflow resume
管理阶段可以用antfarm workflow list查看有哪些可用工作流,用antfarm workflow uninstall
如果想彻底清理,用antfarm uninstall可以删掉所有代理、定时任务和数据库。
日常监控除了仪表盘,还可以用antfarm logs查看最近的日志。
站在Ralph的肩膀上:从单兵到团队的进化
Antfarm不是凭空出现的,它建立在Ralph这个已经验证过的模式之上。
Ralph的核心思想很简单:用一个bash循环不断重启AI代理,每次都用全新的上下文,通过文件系统来持久化记忆。
这个模式最早由杰弗里·亨特利(Geoffrey Huntley)提出,命名来自《辛普森一家》里的拉尔夫·维古姆,就是那个 famously persistent 的小孩。瑞安·卡森把这个模式发扬光大,先做了Ralph的单代理版本,在GitHub上拿了九千八百颗星星,又在X平台上被一百八十万人围观学习。
现在Antfarm把Ralph从单兵作战升级成了团队协作,但核心哲学没变:新鲜上下文、文件持久化、确定性流程。
这种进化路径特别符合软件工程的发展规律,先解决单个开发者的问题,再解决团队协作的问题。
为什么现在正是时候:大模型能力跃迁的临界点
Antfarm的出现时机绝非偶然,它踩在了大模型能力跃迁的关键节点上。早几年模型还不够聪明,必须用很紧的护栏(guardrails)框住它,每一步都要人工检查,不然就会跑偏。但现在随着Opus 4.5和Gemini 3这些新一代模型的发布,AI终于聪明到可以"mostly autonomous"了,大部分情况下都能自主决策,不需要人类一直盯着。
这种能力跃迁让多智能体协作从理论变成了实践,因为代理之间可以可靠地交接任务,而不是每一步都要人类介入救火。瑞安·卡森敏锐地捕捉到了这个转折点,把之前积累的Ralph经验升级成了Antfarm的团队协作框架,正好赶上了这波技术红利。
极简架构的哲学:拒绝过度工程化
Antfarm的架构设计体现了一种反潮流的极简主义。在这个动辄微服务、容器编排、事件驱动的时代,Antfarm选择了最古老的三大件:YAML配置文件、SQLite数据库、cron定时任务。
没有Redis,没有Kafka,没有Docker,没有Kubernetes,就是一个纯TypeScript写的命令行工具,零外部依赖。
这种极简带来了几个好处:
首先是部署简单,只要Node.js环境就能跑;其次是调试容易,出了问题看日志就能定位;
再次是理解成本低,任何人都能读懂YAML配置明白系统在干什么;
最后是维护轻松,不用担心哪个中间件版本不兼容。
这种"够用就好"的哲学特别适合个人开发者和小团队,不需要专门的运维人员,一个人就能搞定全部。