卡帕西自曝:二十年编程流程,竟在数周内被Claude彻底翻转


卡帕西推文:几周内编码模式突遭颠覆,从80%手写到80%AI代理,开始用自然语言编程,遭遇二十年最大工作流变革。

这几周疯狂用 Claude 写代码,随手记点杂感。

【编程 workflow 大变身】

最近这几个月 LLM 写代码的能力突飞猛进,我跟很多人一样,工作流在几周内彻底 flipped(翻转)了。十一月份的时候,我还大概是八成自己动手写代码加IDE自动补全,两成靠 AI 代理搞定。到了十二月,直接反过来,八成让 AI 代理干,两成我自己改改细节、修修补补。

说白了,我现在基本上是在用英文写代码,就是字面意义上的"说话"——有点不好意思地告诉大模型"这儿写个啥,那儿改个啥"。
自尊心确实有点受伤,毕竟干了快二十年程序员,突然不会写代码了似的。

但是这种能一次性用大段"code actions"来操控软件的能力,实在是太香了。一旦你适应了、配置好了、摸清楚它的脾气、搞懂它什么行什么不行之后,根本回不去。

这绝对是我编程生涯近二十年来最剧烈的一次 workflow 变革,而且就发生在短短几周之内。我估计现在已经有两位数百分比的工程师正在经历类似的转变,但普通大众对此的感知可能还停留在个位数百分比。

【IDE、智能体群和犯错问题】

现在社会上两种 hype(炒作)都有点过头了:一种是"以后不需要 IDE 了",一种是"智能体 swarm(蜂群)要统治一切"。

我的看法是,模型现在还是会犯错,而且如果你写的是正经重要的代码,最好还是像看鹰一样盯着它,旁边开个大大的 IDE 窗口随时检查。

现在的错误跟以前不一样了,不再是简单的语法错误,而是那种微妙的概念性错误——就像是那种有点马虎、赶时间的初级程序员会犯的那种。

最常见的情况是:模型会擅自做主、假设一些你根本没说过的事情,然后带着这些假设一路狂奔,完全不去验证。

它们也不会管理自己的困惑,不会说"这儿我没搞懂,能不能解释一下",不会指出代码里的矛盾,不会给你列出 tradeoff(权衡利弊),不会在该反驳的时候反驳你,有时候还太过于讨好你(sycophancy,就是顺着你说)。

如果开 planning mode(规划模式)会好一些,但我们需要一个更轻量级的 inline planning mode。

另外它们真的特别喜欢把代码和 API 搞得太复杂,层层抽象叠罗汉,而且从不清理自己留下的死代码。它们能用一千行代码堆出一个又慢又臃肿又脆弱的架构,你得在旁边提醒:"呃,这玩意儿能不能简单点?" 它立马会说"当然可以!" 然后咔咔改成一百行。

有时候它们还会擅自改或者删掉一些注释乃至代码,就因为这些内容它们不喜欢或者没怎么看懂,哪怕这些内容跟当前任务根本无关。
就算我在 CLAUDE.md 文件里写了好几条规矩想解决这个问题,还是会出这种状况。

尽管有这么多毛病,整体上依然是巨大的进步,很难想象还要回去手写代码。

总结就是,每个人现在都在摸索自己的 workflow,我现在的配置是:左边开几个 Claude Code 的 session(用 ghostty 终端窗口或标签页),右边开着 IDE 看代码加手动改。

【拼劲儿】

看 AI 智能体不知疲倦地死磕一个问题,这事儿特别有意思。它们从不累,从不沮丧,从不心态崩了,就一直在那儿试来试去。换成人类早放弃了,改天再战了。看着它为了一件事挣扎半小时最后终于搞定,你会有一种"感受到 AGI(通用人工智能)临门一脚"的震撼。你会意识到,"耐力"其实是工作的核心瓶颈,而现在有了 LLM,这个瓶颈被大幅拓宽了。

【加速效应】

很难说 LLM 到底带来了多少倍"提速"。我当然觉得自己写东西比以前快多了,但主要效果其实是我干的事儿变多了,因为两点:
第一,以前觉得不值得花时间写的小工具小功能,现在都能随手让 AI 写了;
第二,以前因为知识或技能门槛碰都不敢碰的代码,现在也能上手了。

所以确实是提速,但更像是"业务扩张"——你能覆盖的疆域变大了。

【杠杆效应】
LLM 特别擅长一件事:循环迭代直到达成特定目标。这才是"感受到 AGI 魔法"的核心所在。别告诉它"怎么做",告诉它"做成什么样算成功",然后看它表演。
先让它写测试,再让它跑通测试;
把它跟浏览器 MCP(AI 操控浏览器的工具)连起来让它自己查资料;
先写个简单粗暴但大概率正确的算法,再让它在保证正确的前提下优化;
把你的思路从"命令式"(一步步指挥)改成"声明式"(描述目标),让智能体能循环跑更久,你就能获得更大的 leverage(杠杆效应)。

【好玩】
我没想到,用了智能体之后编程反而变得更有趣了。因为很多"填空题"式的枯燥重复劳动被干掉了,剩下的都是创造性部分。

我也不那么容易卡壳了(卡壳真的很难受),而且胆子变大了,因为无论遇到什么难题,基本上都能找到跟 AI 协作、逐步推进的办法。

当然我也听到过相反的声音:以后程序员会分化成两类,
一类是真心喜欢写代码 process(过程)的,
一类是喜欢 building(产出结果)的,

LLM 会让这两类人走向不同的方向。

【能力退化】

我已经开始注意到,自己手写代码的能力在慢慢退化。

"生成"(写代码)和"辨别"(读代码)是大脑里两套不同的能力。
主要是因为编程里有太多小的语法细节,你现在看代码还是能看懂,但真要自己从零写,可能会卡壳。

【垃圾内容末日】

我在为 2026 年做准备,我预感那一年会是"slopocalypse"(slop+apocalypse,垃圾内容大灾变)元年。
GitHub、Substack、Arxiv、X/Instagram 还有所有数字媒体都会被 AI 生成的低质量内容淹没。

我们还会看到更多 AI 炒作的生产力表演(虽然现在已经够多了),混在真正有价值的进步中间。

【一些问题】

脑子里有几个问题在转悠:
- "10倍工程师"这个概念会变成什么样?就是普通程序员和顶级程序员 productivity 的差距。很有可能这个差距会变得巨大无比。
- 有了 LLM,通才(generalist)会不会越来越 outperform(碾压)专才(specialist)?因为 LLM 特别擅长填 small gaps(微观细节),但不擅长 grand strategy(宏观战略)。
- 未来用 LLM 编程会是什么感觉?会像玩星际争霸?像玩异星工厂(Factorio)?还是像玩音乐?
- 整个社会有多少产业是被"数字知识工作"卡脖子的?

【太长不看版总结】

那我们到底在哪?Claude 和 Codex 这些 LLM 智能体的能力在 2025 年十二月左右跨越了一个"连贯性阈值",在软件工程和相关领域引发了一场相变(phase shift)。智能这部分突然感觉领先了其他所有东西一大截——集成(工具、知识)、新的组织 workflow 需求、流程设计、能力扩散等等。2026 年会是高能的一年,整个行业都在消化这套新能力。

作者

Andrej Karpathy(安德烈·卡帕西),AI 圈尊称他为"卡帕西"或"K 神",简单说就是当今世界最会教 AI 的 AI 大神。