OpenClaw开源项目一天三千个提交的秘密:智能体工厂模式

十几个兼职的人一天冲三千个提交,他们是怎么做到的?一天三千个提交:OpenClaw工厂模式背后的管理革命

OpenClaw这个开源项目,十几个兼职维护者,一天能搞出三千个提交。你以为他们是靠拼命加班?不是。他们靠的是把AI智能体当工人用,把自己从码农变成车间主任。这背后的玩法,跟以前写代码完全是两码事。



你醒来就看到一个新世界

我早上起床刷手机,发现OpenClaw又整出新活了。那个感觉就像你昨晚刚看完更新日志,今天一睁眼,技术又往前跳了一大步。项目里有人发了个梗图,说他们提交代码的速度快到你连差异对比都来不及读完。

这听起来像是吹牛。一天三千个提交,十几个兼职的人,大家还有正经工作。彼得白天在OpenAI上班,文森特也在别的公司干活。就靠业余时间,能把一个开源项目干到这个地步?

但你仔细看,这不是运气,也不是谁手速快。这是他们把整个工作方式给换了。

以前我们写代码,是一个人对着编辑器,一行一行敲。现在他们是一堆AI智能体同时跑,每个智能体负责一块事。你坐在那儿,看着十几个窗口同时推进,有的在修bug,有的在加功能,有的在跑测试。

文森特说,他最高纪录是一天接近三千个提交。而且你看他的提交时间就能看出他几点睡觉几点起床。因为一到他睡觉的点,提交就停了。睡醒了,又开始哗哗往外冒。

这不正常。正常的开源项目,一天能有几十个提交就算活跃了。但他们把这个变成了常态。



你还在等PR审核,人家已经重构完了

这中间有一个特别疯的故事。有天文森特和彼得跑到英伟达去谈合作。英伟达的人说,我们在搞一个叫Nemo Claw的东西。文森特一听,说那我们来帮你们搞吧。

两个人坐在英伟达的办公室里,一人一台笔记本。文森特觉得屏幕太小,找英伟达的人要了个外接显示器。彼得也要了一个,结果英伟达给了个更大的。

两个人就开始干活。彼得的笔记本连着家里的Mac Studio,远程挂着。文森特这边也开了十几个会话。两个人加起来,加上底层的子智能体,可能有六七十个AI同时在跑。

就在他们热火朝天搞Nemo Claw的时候,团队里另一个维护者干了一件大事。他决定把代码库里的文件夹挪一挪。这一挪,把整个消息通道的代码全挪了位置。就是那些跟微软Teams、Slack对接的代码,全给挪到别的地方去了。

文森特一看,心说完了,这下全乱套了。但他们做了一个特别疯狂的决定。当时是凌晨两点,大家都累了,脑子可能也不太清醒。有人说,要不我们把整个代码库重构了吧。

重构。整个代码库。凌晨两点。

听起来像是喝多了才会干的事。但他们真干了。

两千七百个提交,接近一百万行代码的变动,百分之八十二的核心代码被碰了一遍。到早上的时候,插件架构就上线了。

你想想这个速度。正常公司做一个这么大的重构,得开多少会,写多少设计文档,做多少轮代码审核。他们就用了一个晚上,还是凌晨两点临时起意的。



那些AI写的烂测试反倒救了命

你可能要问,他们怎么敢这么干?怎么保证不出错?

这里有个特别反常识的事。救他们的,恰恰是那些AI最喜欢写的、特别傻的单元测试。

文森特说,AI写单元测试有个毛病,就是特别喜欢过拟合。什么叫过拟合?就是测试写得太死板,跟当前代码的具体写法绑得太紧。正常程序员会觉得这种测试不好,因为以后改代码的时候测试也会跟着碎一地。

但恰恰是这种过拟合的测试,在这次重构里救了他们。因为他们把整个代码库翻了个底朝天,很多东西都变了。但那些过拟合的测试还在。只要这些测试能跑通变绿,他们就大概知道自己没跑偏。

这就像一个房子,你把里面的墙全敲了重新砌,但原来那些歪歪扭扭的旧水管还在。只要旧水管不漏水,你就知道新墙没把管线打断。

文森特自己也说,那天晚上他一度觉得自己飞得太高离太阳太近了。用他们项目里的话说,就是“是不是嗨过头了”。但团队最后还是把代码库给拼回来了。



你不是程序员,你是车间主任

那么他们到底是怎么做到的?文森特把他的方法叫做工厂模式。

他不是只开一个AI会话写代码。他同时开五个、十个、二十个会话。每个会话就像一条生产线。这些生产线分不同的泳道。

有的泳道专门跑持续集成。有的泳道专门做新功能。有的泳道专门修bug。

比如他现在觉得代码库挺稳定的,想重构一下测试代码。那他就把这件事交给一号和二号泳道。这两个泳道的智能体不需要他一直盯着。他就告诉它们,你们慢慢来,跑通测试了就提交,别管别的。

但如果三号和四号泳道在处理跟Docker有关的问题,或者某个消息通道出了状况,那他就要跟这些智能体多聊几句。它们会自己去查问题,干完活回来跟他汇报。

五号泳道可能在看新报出来的紧急问题。这个泳道还会去查GitHub上的数据,或者从Discord频道里捞信息。每次发新版本的时候,他们会问这个泳道,过去两个小时发生了什么我需要关心的事。

这个工厂的规模是可以伸缩的。忙的时候多开几条线,闲的时候少开几条。

你现在明白了吗?他不是在写代码,他是在管一个车间。他的角色不是程序员,是车间主任。他的工作不是敲键盘,是分配任务、跟踪进度、处理异常。



最大的瓶颈不是令牌,是你的脑子

文森特说了一个很有意思的现象。大部分人觉得用AI写代码的瓶颈是令牌,就是你得花钱买AI的调用次数。但实际上,对他们来说,令牌已经不是问题了。

真正的瓶颈是什么?是算力,是他自己的脑力。

他要同时盯着这么多智能体在干什么,要判断哪个需要他插手,哪个可以自己跑。这个东西非常耗神。

而且他后来踩了一个大坑。他为了让每个智能体独立干活不互相干扰,用了Git的worktree功能。这个东西可以在同一个代码仓库里开多个独立的工作目录,每个目录可以同时做不同的事情互不影响。

听起来很完美对吧?但问题是,他每天要开七八十个worktree。每个worktree都是一个独立的代码副本,都要跑测试。他的电脑直接被干翻了。

后来他只能自己写了个脚本,让他的编程环境能智能地管理这些worktree。按一下退出键程序会崩,但崩了之后会自动恢复、自己修自己。

他说其实彼得和其他人用的方法更简单粗暴:直接把整个代码仓库克隆十份,每个编程会话指到不同的克隆目录就完了。他后悔自己当初非要玩worktree这个高级功能。

所以你看,连这些老手也会踩坑。但关键是,踩了坑能爬出来,还能自己写工具把坑填上。



你能感觉到智能体在跟你胡说八道

这里有一个特别玄学的东西。文森特说,他现在看那些智能体在跑的时候,能感觉到哪个不对劲。

他拿《黑客帝国》打了个比方。电影里有一个场景,尼奥看着屏幕上密密麻麻的代码问,你怎么读得懂这些东西?那个人回答说,你看久了就知道,那个穿红裙子的女人代表什么,那个遛狗的人代表什么。

文森特说他现在就是这种感觉。他盯着屏幕上的日志,有时候会觉得,哎,这个智能体说话的味道不对。

不是因为它做的事不对,而是因为它解释自己的方式不对。它在那绕来绕去说废话,说不清楚自己在干嘛。它好像自己都不知道自己在干什么。

这种感觉特别像你管一个员工。如果这个员工开始跟你东拉西扯、说一堆漂亮话但就是不解决问题,你会觉得不对劲。你会问他,你到底在干嘛?

文森特说,碰到这种情况,他有时候就直接把整个会话关了。这块代码他不碰了,换别的维护者来搞,或者过四五天再说。

这种直觉不是天生的。他是靠过去一年疯狂地跑AI、疯狂地冲提交量,硬生生练出来的。量堆上去了,感觉就出来了。

这就像你开了一年的车,不用看转速表听发动机声音就知道该换挡了。你讲不清楚你是怎么知道的,但你就是知道。



管理AI和管理人用的是同一套本事

有一个问题经常有人问文森特:你怎么同时管十个以上的AI智能体?

他反问了一个问题:你怎么同时管十个以上的员工?

对方说不出话。

文森特说他以前在大公司干过,管过航空公司之类的大团队,三四十个人都管过。所以对他来说,管十几个AI智能体,本质上跟管人是通的。

真正重要的不是什么高大上的技术,是软技能。你怎么问你的智能体“现在什么情况”?你怎么判断它有没有在跟你胡说八道?你怎么分配任务能让整条生产线不堵车?

你要给它们清晰的目标。你不能说“你去把代码搞好”,你要说“你去把这个模块的测试覆盖率从百分之六十提到百分之八十,跑通了就提交”。

你要知道什么时候该放手让它们自己干,什么时候该插手干预。你要懂得看日志,就像看员工的工作报告一样,从字里行间读出真实情况。

这些东西,学校里不教。刷题不考。但在这个新世界里,它们比你会不会写快排重要得多。



所有人都在偷偷用,只是嘴上不承认

文森特说,现在这个情况跟当年ChatGPT刚出来的时候一模一样。

ChatGPT刚出来的时候,所有人都在公开场合说这个东西不靠谱、有风险、不能用。但私底下,每个人都在偷偷用。大家一边嘴上骂,一边心里慌,一边不停地跟它聊天。

现在自主AI智能体也是这样。有些大公司已经公开承认了。Anthropic用智能体写了一个新的C语言编译器。Spotify说他们基本上不再手工写代码了。有个叫史蒂夫·耶格的技术大佬,说自己一天能推五十个拉取请求,全是一个人加AI搞定的,他管自己叫“氛围维护者”。

OpenClaw把他们全超了。高峰时期一天八百个提交。十几个兼职的人。

文森特说,这种速度很快就会变成行业标配。以后你回头看,会觉得一天几十个提交才是奇怪的。审核拉取请求、一行一行看代码差异,那一套可能真的行不通了。

但这里面还是有工程。不是乱搞,是有组织地乱搞。或者说,是在乱搞的表面底下,有一层新的工程方法在慢慢成型。



怎么管PR比怎么写代码还重要

他们怎么处理拉取请求?这也是一个问题。

项目里的PR多到离谱。有个新维护者刚加入,一看,六千个待处理的PR,当场就蒙了。说我们要怎么搞?我要写个聚类算法把这些PR分分类。

文森特自己也有一个版本。他做了个语义图谱,把整个GitHub上的数据做了向量嵌入。一个PR就能扯出七万三千一百零六条关系边。

但问题是,每个人都觉得自己找到了终极解法,每个人都交了自己那一版的方案。最后这些方案本身也变成了噪音。

所以他们后来有了一套自己的方法。不一定叫路线图,但有一套去重和排序的机制。比如某个问题被反复提出来,压力一直往上顶,那就说明这个问题确实大,值得花时间去搞。

这就像你在一个巨大的工厂里,流水线上堆满了零件。你不能每个都摸一遍。你得有办法知道哪个是急活,哪个可以往后放。

他们还搞了一套评估系统。重构完代码之后,他们自己搭了一个假的Slack,里面有假模型也有真模型。在这个假Slack上跑各种测试,确保每个消息通道和每个AI模型供应商都能正常工作。

你想不到吧?一个看起来像草台班子的项目,背后也有这么正经的测试流程。



软技能决定你能跑多快

文森特最后说了一句总结的话。2025年是冲令牌的一年,谁烧的令牌多谁牛。2026年是不能浪费令牌的一年,谁用得聪明谁牛。

这背后的东西,不是写代码的技术,是管理的技术。

你怎么让十几个AI智能体像一条流水线一样干活,不打架、不堵车、不出错。你怎么在自己脑子烧糊之前,从日志里嗅出不对劲的味道。你怎么在一堆乱七八糟的请求里,找出真正值得干的事。

这些全是软技能。是以前大家觉得文科生才需要的东西。但现在,写代码最猛的那批人,拼的恰恰是这些。

你可能会觉得,这离你很远。你又不是OpenClaw的核心维护者,你也没机会一天冲三千个提交。

但你仔细想想。以后每个写代码的人,都会变成那个车间主任。你开的智能体可能没那么多,三五个。但你要管的事是一样的:分配任务、跟踪进度、处理异常、判断谁在胡说八道。

这东西练不出来吗?能。就像文森特说的,他是靠一年的疯狂跑量练出来的直觉。你不需要冲到三千个提交一天,但你可以从三个开始。从今天开始,给你的AI分配一个任务,然后看着它干,学着判断它靠不靠谱。

这不是在学怎么用工具。这是在学怎么当老板。



总结

OpenClaw开源项目一天三千个提交的秘密,不是堆人也不是拼手速,而是把AI智能体当工人、把自己当车间主任。本文解释了这背后的工厂模式、管理方法和软技能。适合所有对AI编程、开源协作、未来工作方式感兴趣的人。

论文信息:基于OpenClaw架构师Vincent Koc在相关分享中的演讲内容整理,聚焦OpenClaw项目的高频提交现象及其背后的工程管理模式。