AI端侧应用、氛围编程

OpenClaw开源项目一天三千个提交的秘密：智能体工厂模式

#OpenClaw #DevOps教程 #CICD持续集成交付专栏 #AI智能体Agent

2026-06-08 1 6K banq

十几个兼职的人一天冲三千个提交，他们是怎么做到的？一天三千个提交：OpenClaw工厂模式背后的管理革命

OpenClaw这个开源项目，十几个兼职维护者，一天能搞出三千个提交。你以为他们是靠拼命加班？不是。他们靠的是把AI智能体当工人用，把自己从码农变成车间主任。这背后的玩法，跟以前写代码完全是两码事。

你醒来就看到一个新世界

我早上起床刷手机，发现OpenClaw又整出新活了。那个感觉就像你昨晚刚看完更新日志，今天一睁眼，技术又往前跳了一大步。项目里有人发了个梗图，说他们提交代码的速度快到你连差异对比都来不及读完。

这听起来像是吹牛。一天三千个提交，十几个兼职的人，大家还有正经工作。彼得白天在OpenAI上班，文森特也在别的公司干活。就靠业余时间，能把一个开源项目干到这个地步？

但你仔细看，这不是运气，也不是谁手速快。这是他们把整个工作方式给换了。

以前我们写代码，是一个人对着编辑器，一行一行敲。现在他们是一堆AI智能体同时跑，每个智能体负责一块事。你坐在那儿，看着十几个窗口同时推进，有的在修bug，有的在加功能，有的在跑测试。

文森特说，他最高纪录是一天接近三千个提交。而且你看他的提交时间就能看出他几点睡觉几点起床。因为一到他睡觉的点，提交就停了。睡醒了，又开始哗哗往外冒。

这不正常。正常的开源项目，一天能有几十个提交就算活跃了。但他们把这个变成了常态。

你还在等PR审核，人家已经重构完了

这中间有一个特别疯的故事。有天文森特和彼得跑到英伟达去谈合作。英伟达的人说，我们在搞一个叫Nemo Claw的东西。文森特一听，说那我们来帮你们搞吧。

两个人坐在英伟达的办公室里，一人一台笔记本。文森特觉得屏幕太小，找英伟达的人要了个外接显示器。彼得也要了一个，结果英伟达给了个更大的。

两个人就开始干活。彼得的笔记本连着家里的Mac Studio，远程挂着。文森特这边也开了十几个会话。两个人加起来，加上底层的子智能体，可能有六七十个AI同时在跑。

就在他们热火朝天搞Nemo Claw的时候，团队里另一个维护者干了一件大事。他决定把代码库里的文件夹挪一挪。这一挪，把整个消息通道的代码全挪了位置。就是那些跟微软Teams、Slack对接的代码，全给挪到别的地方去了。

文森特一看，心说完了，这下全乱套了。但他们做了一个特别疯狂的决定。当时是凌晨两点，大家都累了，脑子可能也不太清醒。有人说，要不我们把整个代码库重构了吧。

重构。整个代码库。凌晨两点。

听起来像是喝多了才会干的事。但他们真干了。

两千七百个提交，接近一百万行代码的变动，百分之八十二的核心代码被碰了一遍。到早上的时候，插件架构就上线了。

你想想这个速度。正常公司做一个这么大的重构，得开多少会，写多少设计文档，做多少轮代码审核。他们就用了一个晚上，还是凌晨两点临时起意的。

那些AI写的烂测试反倒救了命

你可能要问，他们怎么敢这么干？怎么保证不出错？

这里有个特别反常识的事。救他们的，恰恰是那些AI最喜欢写的、特别傻的单元测试。

文森特说，AI写单元测试有个毛病，就是特别喜欢过拟合。什么叫过拟合？就是测试写得太死板，跟当前代码的具体写法绑得太紧。正常程序员会觉得这种测试不好，因为以后改代码的时候测试也会跟着碎一地。

但恰恰是这种过拟合的测试，在这次重构里救了他们。因为他们把整个代码库翻了个底朝天，很多东西都变了。但那些过拟合的测试还在。只要这些测试能跑通变绿，他们就大概知道自己没跑偏。

这就像一个房子，你把里面的墙全敲了重新砌，但原来那些歪歪扭扭的旧水管还在。只要旧水管不漏水，你就知道新墙没把管线打断。

文森特自己也说，那天晚上他一度觉得自己飞得太高离太阳太近了。用他们项目里的话说，就是“是不是嗨过头了”。但团队最后还是把代码库给拼回来了。

你不是程序员，你是车间主任

那么他们到底是怎么做到的？文森特把他的方法叫做工厂模式。

他不是只开一个AI会话写代码。他同时开五个、十个、二十个会话。每个会话就像一条生产线。这些生产线分不同的泳道。

有的泳道专门跑持续集成。有的泳道专门做新功能。有的泳道专门修bug。

比如他现在觉得代码库挺稳定的，想重构一下测试代码。那他就把这件事交给一号和二号泳道。这两个泳道的智能体不需要他一直盯着。他就告诉它们，你们慢慢来，跑通测试了就提交，别管别的。

但如果三号和四号泳道在处理跟Docker有关的问题，或者某个消息通道出了状况，那他就要跟这些智能体多聊几句。它们会自己去查问题，干完活回来跟他汇报。

五号泳道可能在看新报出来的紧急问题。这个泳道还会去查GitHub上的数据，或者从Discord频道里捞信息。每次发新版本的时候，他们会问这个泳道，过去两个小时发生了什么我需要关心的事。

这个工厂的规模是可以伸缩的。忙的时候多开几条线，闲的时候少开几条。

你现在明白了吗？他不是在写代码，他是在管一个车间。他的角色不是程序员，是车间主任。他的工作不是敲键盘，是分配任务、跟踪进度、处理异常。

最大的瓶颈不是令牌，是你的脑子

文森特说了一个很有意思的现象。大部分人觉得用AI写代码的瓶颈是令牌，就是你得花钱买AI的调用次数。但实际上，对他们来说，令牌已经不是问题了。

真正的瓶颈是什么？是算力，是他自己的脑力。

他要同时盯着这么多智能体在干什么，要判断哪个需要他插手，哪个可以自己跑。这个东西非常耗神。

而且他后来踩了一个大坑。他为了让每个智能体独立干活不互相干扰，用了Git的worktree功能。这个东西可以在同一个代码仓库里开多个独立的工作目录，每个目录可以同时做不同的事情互不影响。

听起来很完美对吧？但问题是，他每天要开七八十个worktree。每个worktree都是一个独立的代码副本，都要跑测试。他的电脑直接被干翻了。

后来他只能自己写了个脚本，让他的编程环境能智能地管理这些worktree。按一下退出键程序会崩，但崩了之后会自动恢复、自己修自己。

他说其实彼得和其他人用的方法更简单粗暴：直接把整个代码仓库克隆十份，每个编程会话指到不同的克隆目录就完了。他后悔自己当初非要玩worktree这个高级功能。

所以你看，连这些老手也会踩坑。但关键是，踩了坑能爬出来，还能自己写工具把坑填上。

你能感觉到智能体在跟你胡说八道

这里有一个特别玄学的东西。文森特说，他现在看那些智能体在跑的时候，能感觉到哪个不对劲。

他拿《黑客帝国》打了个比方。电影里有一个场景，尼奥看着屏幕上密密麻麻的代码问，你怎么读得懂这些东西？那个人回答说，你看久了就知道，那个穿红裙子的女人代表什么，那个遛狗的人代表什么。

文森特说他现在就是这种感觉。他盯着屏幕上的日志，有时候会觉得，哎，这个智能体说话的味道不对。

不是因为它做的事不对，而是因为它解释自己的方式不对。它在那绕来绕去说废话，说不清楚自己在干嘛。它好像自己都不知道自己在干什么。

这种感觉特别像你管一个员工。如果这个员工开始跟你东拉西扯、说一堆漂亮话但就是不解决问题，你会觉得不对劲。你会问他，你到底在干嘛？

文森特说，碰到这种情况，他有时候就直接把整个会话关了。这块代码他不碰了，换别的维护者来搞，或者过四五天再说。

这种直觉不是天生的。他是靠过去一年疯狂地跑AI、疯狂地冲提交量，硬生生练出来的。量堆上去了，感觉就出来了。

这就像你开了一年的车，不用看转速表听发动机声音就知道该换挡了。你讲不清楚你是怎么知道的，但你就是知道。

管理AI和管理人用的是同一套本事

有一个问题经常有人问文森特：你怎么同时管十个以上的AI智能体？

他反问了一个问题：你怎么同时管十个以上的员工？

对方说不出话。

文森特说他以前在大公司干过，管过航空公司之类的大团队，三四十个人都管过。所以对他来说，管十几个AI智能体，本质上跟管人是通的。

真正重要的不是什么高大上的技术，是软技能。你怎么问你的智能体“现在什么情况”？你怎么判断它有没有在跟你胡说八道？你怎么分配任务能让整条生产线不堵车？

你要给它们清晰的目标。你不能说“你去把代码搞好”，你要说“你去把这个模块的测试覆盖率从百分之六十提到百分之八十，跑通了就提交”。

你要知道什么时候该放手让它们自己干，什么时候该插手干预。你要懂得看日志，就像看员工的工作报告一样，从字里行间读出真实情况。

这些东西，学校里不教。刷题不考。但在这个新世界里，它们比你会不会写快排重要得多。

所有人都在偷偷用，只是嘴上不承认

文森特说，现在这个情况跟当年ChatGPT刚出来的时候一模一样。

ChatGPT刚出来的时候，所有人都在公开场合说这个东西不靠谱、有风险、不能用。但私底下，每个人都在偷偷用。大家一边嘴上骂，一边心里慌，一边不停地跟它聊天。

现在自主AI智能体也是这样。有些大公司已经公开承认了。Anthropic用智能体写了一个新的C语言编译器。Spotify说他们基本上不再手工写代码了。有个叫史蒂夫·耶格的技术大佬，说自己一天能推五十个拉取请求，全是一个人加AI搞定的，他管自己叫“氛围维护者”。

OpenClaw把他们全超了。高峰时期一天八百个提交。十几个兼职的人。

文森特说，这种速度很快就会变成行业标配。以后你回头看，会觉得一天几十个提交才是奇怪的。审核拉取请求、一行一行看代码差异，那一套可能真的行不通了。

但这里面还是有工程。不是乱搞，是有组织地乱搞。或者说，是在乱搞的表面底下，有一层新的工程方法在慢慢成型。

怎么管PR比怎么写代码还重要

他们怎么处理拉取请求？这也是一个问题。

项目里的PR多到离谱。有个新维护者刚加入，一看，六千个待处理的PR，当场就蒙了。说我们要怎么搞？我要写个聚类算法把这些PR分分类。

文森特自己也有一个版本。他做了个语义图谱，把整个GitHub上的数据做了向量嵌入。一个PR就能扯出七万三千一百零六条关系边。

但问题是，每个人都觉得自己找到了终极解法，每个人都交了自己那一版的方案。最后这些方案本身也变成了噪音。

所以他们后来有了一套自己的方法。不一定叫路线图，但有一套去重和排序的机制。比如某个问题被反复提出来，压力一直往上顶，那就说明这个问题确实大，值得花时间去搞。

这就像你在一个巨大的工厂里，流水线上堆满了零件。你不能每个都摸一遍。你得有办法知道哪个是急活，哪个可以往后放。

他们还搞了一套评估系统。重构完代码之后，他们自己搭了一个假的Slack，里面有假模型也有真模型。在这个假Slack上跑各种测试，确保每个消息通道和每个AI模型供应商都能正常工作。

你想不到吧？一个看起来像草台班子的项目，背后也有这么正经的测试流程。

软技能决定你能跑多快

文森特最后说了一句总结的话。2025年是冲令牌的一年，谁烧的令牌多谁牛。2026年是不能浪费令牌的一年，谁用得聪明谁牛。

这背后的东西，不是写代码的技术，是管理的技术。

你怎么让十几个AI智能体像一条流水线一样干活，不打架、不堵车、不出错。你怎么在自己脑子烧糊之前，从日志里嗅出不对劲的味道。你怎么在一堆乱七八糟的请求里，找出真正值得干的事。

这些全是软技能。是以前大家觉得文科生才需要的东西。但现在，写代码最猛的那批人，拼的恰恰是这些。

你可能会觉得，这离你很远。你又不是OpenClaw的核心维护者，你也没机会一天冲三千个提交。

但你仔细想想。以后每个写代码的人，都会变成那个车间主任。你开的智能体可能没那么多，三五个。但你要管的事是一样的：分配任务、跟踪进度、处理异常、判断谁在胡说八道。

这东西练不出来吗？能。就像文森特说的，他是靠一年的疯狂跑量练出来的直觉。你不需要冲到三千个提交一天，但你可以从三个开始。从今天开始，给你的AI分配一个任务，然后看着它干，学着判断它靠不靠谱。

这不是在学怎么用工具。这是在学怎么当老板。

总结

OpenClaw开源项目一天三千个提交的秘密，不是堆人也不是拼手速，而是把AI智能体当工人、把自己当车间主任。本文解释了这背后的工厂模式、管理方法和软技能。适合所有对AI编程、开源协作、未来工作方式感兴趣的人。

论文信息：基于OpenClaw架构师Vincent Koc在相关分享中的演讲内容整理，聚焦OpenClaw项目的高频提交现象及其背后的工程管理模式。