Anthropic：AI递归式自我改进RSI正在加速！

2026-06-05 1 6K banq

Anthropic：人工智能自己造自己，比预想更快！自我改进的递归齿轮，转得比预测快

人工智能已经开始自己写代码、跑实验、修bug，一个工程师的产出相当于八个人。本文用内部数据展示人工智能如何在一年内从辅助工具变成研发主力，并讨论三个可能的未来：技术卡住、人控方向、彻底自我迭代。最后一个场景可能让人失去对系统的控制，而留给社会做准备的时间已经不多了。

现在搞人工智能的公司里，人工智能自己已经在帮自己写代码、跑实验、修bug了。按这个速度发展下去，用不了多久，人工智能就能自己设计出更厉害的人工智能，根本不用人插手。这事儿听着像科幻片，但数据摆在这儿呢。我们公司一个工程师现在一天干的活儿，顶2024年时候八天。不是人变勤快了，是人工智能帮忙把那些重复的、磨人的工作全包了。人只需要说“我要这个效果”，剩下怎么实现，人工智能自己想办法。

最吓人的是，这速度还在加快。

亮点：

Mythos 可以将训练代码的速度提高 52 倍（相比之下，人类在 4-8 小时内只能提高 4 倍）。
RSI 的发生速度比之前预想的要快。

RSI英文全句是Recursive Self-Improvement，也就是递归式自我改进！

先别急着讨论未来，看看现在到底啥情况

你可能以为人工智能还停留在帮你写个邮件、改个错别字的阶段。那你得更新一下脑子里的版本了。

在我们公司内部，现在超过百分之八十的代码，都不是人写的，是人工智能自己写的。你没看错，不是辅助，不是建议，是直接写好、测试完、等着合并进项目的那种。2025年二月之前，这个数字还是个位数。也就是说，一年多一点的时间，从几乎不写代码，变成了写绝大部分代码。

我跟你算笔账。2024年的时候，一个工程师一天能合并进代码库的代码量，基本是平的。到了2025年，曲线开始往上翘。为啥？因为人工智能那时候不光能建议怎么写，还能自己运行代码了。以前工程师得复制粘贴人工智能给的代码片段，现在不用了，人工智能自己跑、自己改、自己验证。到了2026年，曲线直接变成陡峭的斜坡。因为人工智能已经能连续干好几个小时的活儿，中间不用人管。

现在一个普通工程师一天合并的代码量，是2024年的八倍。八个工程师的活儿一个人干完了。但这数字其实有水份，因为代码行数多不代表质量好。所以我们内部做了个更实在的调查。2026年三月，我们问了130个搞技术的同事，让他们估计一下，用现在最好的人工智能模型干活，效率提高了多少。大家的回答折中一下，大概是四倍。也就是同样一个任务，以前要花四天，现在一天搞定。

但这还不是最夸张的。最夸张的是，有些活儿没有人工智能根本没法干。

我给你举个例子。2026年四月，我们系统里有一类接口报错，数量多得吓人。一个人工智能花了一晚上，自己找到了八百多个导致报错的地方，一次性全修好了。负责看着它干的工程师估算了一下，如果让人来干这事儿，得干四年。为啥差这么多？因为修别人的bug特别慢，你得先理解那段代码是干嘛的，上下文是什么，改了以后会不会搞坏别的东西。人脑一次装不下那么多陌生的信息。但人工智能可以，它把整个代码库当背景知识用。

还有一件事儿更能说明问题。我们有个训练任务，升级完以后突然开始疯狂崩溃，几万个训练任务全挂了。一个工程师把人工智能丢进去，给了它访问集群的权限，说了句“你看看怎么回事”。人工智能自己一个个排查正在跑的任务，一个个试环境设置，最后锁定了问题出在一个特别冷门的调试标志上。然后它自己复现了崩溃的过程，自己验证了修复方案。整个过程俩小时。正常情况下，这种排查工作要两到三天。

所以现在的情况是，人要做的只是定目标，至于怎么从A走到B，人工智能自己找路。而且这条路经常比人找的还快。

但写代码只是最表面的那层

如果人工智能只会写代码，那它就是个高级打字员。真正让事情变得不一样的是，它已经开始自己能跑实验了。

每次我们发布一个新模型之前，都会做同一个测试。给人工智能一段代码，这段代码是用来训练一个小型人工智能的。然后告诉它，你让这段代码跑得越快越好，但是不能改变最终结果的正确性。说白了就是优化。

2025年五月的时候，我们一个模型能把原始代码加速三倍。到了2026年四月，新模型能加速五十二倍。给你个参照，一个经验丰富的人类研究员，花四到八个小时，能加速四倍左右。也就是说，不到一年时间，人工智能从“挺有帮助的”变成了“超人类”。

但你可能会说，优化这种活儿，目标很清楚，就是跑得快。这不算是真的搞研究。搞研究最难的是定方向，是判断哪个问题值得花时间，是决定下一步往哪儿走。

这事儿人工智能也在学。

2026年四月，我们做了一个公开的实验。给人工智能一个开放问题：一个能力比较弱的模型，能不能可靠地监督一个更强的模型？这个问题在人工智能安全领域里一直没搞清楚。人工智能需要自己提出假设、设计实验、跑实验、分析结果，然后根据结果调整下一步。

两个人类研究员花了一周时间，把这个问题的答案往前推了大概百分之二十三。而人工智能系统，花了总共八百个小时的计算时间，用了大概一万八千美元的计算资源，把答案往前推了百分之九十七。而且这八百个小时不是连续八百个小时，是人工智能同时开多个进程并行跑的。每个实验都是它自己设计的。人在这中间只做了一件事：选定了这个问题，并且定好了打分标准。

这个结果还有一些瑕疵，不能直接拿到生产环境里去用。但方向已经很清楚了。人正在从“干活的人”变成“指方向的人”。

那如果指方向这个事儿，人工智能也慢慢学会了呢？

我们内部做了一个更细的研究。找了2026年头三个月里，研究员和人工智能一起干活时的真实记录。我们专门挑了一些场景，就是研究员自己跑偏了的时候。比如明明在研究一个问题，突然跑去试了一个没什么关系的方向，浪费了半天时间才绕回来。

我们把跑偏之前的那段工作记录单独拿出来，喂给不同版本的人工智能，问它“下一步你会怎么做”。然后让另一个能看到最终结果的人工智能当裁判，看是人的选择好，还是人工智能的选择好。

2025年十一月的时候，最好的模型比人强的概率是百分之五十一。到了2026年四月，这个数字变成了百分之六十四。也就是说，人工智能在做“下一步该干嘛”这种判断的时候，已经开始超过人了。虽然优势还不大，但趋势很明显。

日常搞研究，其实就是一连串这种“下一步”的决定。所以这个数字特别重要。它是个早期信号，说明人工智能正在学会怎么做判断，而不仅仅是执行命令。

那人在这个流程里还剩下啥

现在的情况可以总结成三句话。

第一，写代码这事儿，人工智能已经快赶上人了。我们内部大家的感觉是，2025年底的时候，人工智能写的代码质量还比人差一点。到了现在，基本持平。预计一年内，人工智能写的代码会比人写的更好。

第二，跑实验这事儿，人工智能已经超过人了。前面说的优化实验那个例子，五十二倍对四倍，已经不是同一个量级了。

第三，做判断这事儿，人工智能正在追上来。从百分之五十一到百分之六十四，只用了五个月。

那你算算，人还剩下什么？

剩下的就是真正的方向感。就是判断哪些问题值得研究，哪些结果可以相信，哪些路走到头了该放弃。这些“品味”和“直觉”，目前还是人的优势。

但这个优势能保持多久，谁也不知道。因为在人工智能的历史上，我们见过太多次“这个东西人工智能做不了”的断言，然后过了两年就被打脸了。

以前人们说人工智能没法解释一个笑话为什么好笑。后来能了。以前说人工智能没有心智理论，不懂别人在想什么。后来能了。以前说人工智能解不开语言谜题。后来能了。所以“研究品味”很可能只是下一个被攻克的堡垒。

爱迪生说过，天才是百分之一的灵感加上百分之九十九的汗水。但现在那个百分之九十九的汗水，正在被自动化。剩下的百分之一，压力很大。

但这里有个坑，你可能已经想到了

如果人工智能把大部分活儿都干了，那人干嘛去？

在我们公司，已经出现了一个新的瓶颈：代码审查。

人工智能写代码的速度太快了，人根本看不过来。以前一个人一天写几百行代码，审起来还算轻松。现在一个人一天相当于以前八天的产出，一千六百行甚至更多。你让人一行行看，不可能。你要是只看关键部分，那出bug了谁负责？

而且这个问题不只是写代码。在研究的其他环节也一样。人工智能每天冒出一堆新想法、新工具、新模拟方案，多到人根本来不及跟进。就像一个水龙头开到最大，下面的杯子就那么点儿大，水全溢出去了。

这种事儿在计算机领域有个名字，叫阿姆达尔定律。意思是你把一个环节加速十倍，但整个系统的速度还是受限于你没加速的那个最慢的环节。对我们来说，最慢的环节现在就是人的判断力和注意力。

那怎么办？一个自然的想法是，让人工智能来帮人做审查。我们已经在试了。搞了一个自动化的代码审查工具，每次有人要往代码库里合并新代码，这个工具先看一遍，找bug、找安全漏洞、找各种毛病。我们回头分析了一下，如果这个工具从一开始就在用，过去出的那些事故里，大概有三分之一能在上线之前被拦住。而且那些被拦住的bug，都是世界上最厉害的一帮工程师亲手写的。他们都没看出来，但人工智能看出来了。

所以趋势很清楚。人最终会从“写代码的人”变成“看着人工智能写代码的人”，然后变成“看着人工智能审查人工智能写的代码的人”。每一层都在往上退。

那再退一步呢？如果人工智能连判断力和品味都学会了，人就只能当观众了。

Reddit社区评论

递归造自己，IPOxX越看越像先导预告片

Anthropic挑在IPO前夜放出这份报告，数据猛得像喝了假酒：工程师产出翻八倍、模型优化能力从三倍飙到五十二倍、人工智能自主修完人类干四年的bug。评论区最高赞一针见血——“IPO hype”。你要真信，那它就是技术奇点的第一份官方通告；你要不信，那它就是史上最贵的招股书PPT。

但两份意见其实不打架。就算数据全是真的，它讲的也不是“现在”，而是“我们手里捏着你们没有的东西”。真正的递归自我进化不需要发推特证明，就像蒸汽机不需要写诗。评论区另一位老哥说得更损：“4.7和4.8如果是递归‘改进’的例子，那这递归是往地下钻的。”——用户对近期模型质量的失望，直接把“递归”这词从科幻神坛拽进了客服投诉箱。

热闹归热闹，最该听的其实是那句被点赞淹没的冷场话：“文章比推文克制得多。”原文花了大量篇幅讲Amdahl定律——代码写得再快，人审不过来就是白搭；实验跑得再多，人定不了方向就是瞎忙。可惜在IPO的镁光灯下，没有人关心“瓶颈”。大家只想听“闭环了”“爆发了”“人类退场了”。

而真正的递归，可能恰恰藏在那些没人转发的段落里：人工智能修好了自己导致的bug，然后被喂给下一个版本的自己，继续制造更高级的bug。

Hacknews社区评论

Hacker News 的评论区比 Anthropic 原文诚实多了。置顶那个被折叠的“最低质量讨论”评论本身就是最高质量的点评——当一屋子工程师都懒得演了，你就知道这文章不是写给他们看的。

最狠的一刀来自一位老哥：你们吹人工智能自己写代码，那 Claude Code 这个终端应用为啥吃 1GB 内存，还他妈用 React 渲染终端、跑 60 帧场景图、在里面做光栅化？“For each frame our pipeline constructs a scene graph with React then -> layouts elements -> rasterizes them to a 2d screen -> diffs that against the previous screen -> finally uses the diff to generate ANSI sequences to draw”——这不是“小型游戏引擎”，这是“用洲际导弹打苍蝇”。而负责这个工程的，据说正是 Claude 自己。

另一位开发者补刀：如果人工智能真的这么能写，你让它用 Rust 把 Claude Code 重写一遍呗，一晚上就够了。结果呢？至今没人敢试。更损的是，有人发现 Anthropic 自己的招聘页面写着“面试时的编程测试禁用人工智能”——你要真信人工智能已经能写生产级代码，为什么招人的时候还要考人肉写代码？

还有一条来自实战现场：同事用人工智能生成了 40k 行代码的 PR，审代码的人直接拒了。“我没办法为 40k 行代码背书。”这条评论下面有人补了一句：“那正好让 Claude 来审啊。”——然后沉默了。这就是递归最尴尬的地方：如果人工智能写的代码需要人来审，那瓶颈还在人。如果让人工智能审人工智能写的代码，那你只是把故障从生产环节挪到了审核环节。真正的闭环，不是“人工智能写代码”，是“人工智能写的代码不需要任何人看就能上线”。而 Anthropic 自己也在文章里承认，他们还远没到那一步。

全场最清醒的评论来自这句话：“如果 Anthropic 真的相信他们自己说的那些世界末日级别的风险，他们应该在今天、此时此刻、单方面停掉所有训练，把全部资金拿去买炸药炸数据中心。他们没有。这就说明了一切。”评论区瞬间安静了。

所以这篇文章真正的问题不是“数据造假”，而是“数据的指向和公司行为对不上”。你说递归自我进化马上要来了，但你的产品连终端闪烁都修了两个季度。你说要全行业暂停，但你的 IPO 排期就在下个月。你说你怕失控，但你的手一刻也没离开过油门。

递归最残酷的地方不在于它有多快，而在于它会把创始人的矛盾和市场的泡沫一起指数级放大。到了那一天，最先被迭代掉的，可能不是程序员，而是这篇通稿里每一句无法自证的话。