卡帕西自曝：二十年编程流程，竟在数周内被Claude彻底翻转

#vibe编程 #AI智能体Agent #IDE编程开发指南 #软件工程资料汇编

2026-01-27 1 3K banq

卡帕西推文：几周内编码模式突遭颠覆，从80%手写到80%AI代理，开始用自然语言编程，遭遇二十年最大工作流变革。

这几周疯狂用 Claude 写代码，随手记点杂感。

【编程 workflow 大变身】

最近这几个月 LLM 写代码的能力突飞猛进，我跟很多人一样，工作流在几周内彻底 flipped（翻转）了。十一月份的时候，我还大概是八成自己动手写代码加IDE自动补全，两成靠 AI 代理搞定。到了十二月，直接反过来，八成让 AI 代理干，两成我自己改改细节、修修补补。

说白了，我现在基本上是在用英文写代码，就是字面意义上的"说话"——有点不好意思地告诉大模型"这儿写个啥，那儿改个啥"。
自尊心确实有点受伤，毕竟干了快二十年程序员，突然不会写代码了似的。

但是这种能一次性用大段"code actions"来操控软件的能力，实在是太香了。一旦你适应了、配置好了、摸清楚它的脾气、搞懂它什么行什么不行之后，根本回不去。

这绝对是我编程生涯近二十年来最剧烈的一次 workflow 变革，而且就发生在短短几周之内。我估计现在已经有两位数百分比的工程师正在经历类似的转变，但普通大众对此的感知可能还停留在个位数百分比。

【IDE、智能体群和犯错问题】

现在社会上两种 hype（炒作）都有点过头了：一种是"以后不需要 IDE 了"，一种是"智能体 swarm（蜂群）要统治一切"。

我的看法是，模型现在还是会犯错，而且如果你写的是正经重要的代码，最好还是像看鹰一样盯着它，旁边开个大大的 IDE 窗口随时检查。

现在的错误跟以前不一样了，不再是简单的语法错误，而是那种微妙的概念性错误——就像是那种有点马虎、赶时间的初级程序员会犯的那种。

最常见的情况是：模型会擅自做主、假设一些你根本没说过的事情，然后带着这些假设一路狂奔，完全不去验证。

它们也不会管理自己的困惑，不会说"这儿我没搞懂，能不能解释一下"，不会指出代码里的矛盾，不会给你列出 tradeoff（权衡利弊），不会在该反驳的时候反驳你，有时候还太过于讨好你（sycophancy，就是顺着你说）。

如果开 planning mode（规划模式）会好一些，但我们需要一个更轻量级的 inline planning mode。

另外它们真的特别喜欢把代码和 API 搞得太复杂，层层抽象叠罗汉，而且从不清理自己留下的死代码。它们能用一千行代码堆出一个又慢又臃肿又脆弱的架构，你得在旁边提醒："呃，这玩意儿能不能简单点？" 它立马会说"当然可以！" 然后咔咔改成一百行。

有时候它们还会擅自改或者删掉一些注释乃至代码，就因为这些内容它们不喜欢或者没怎么看懂，哪怕这些内容跟当前任务根本无关。
就算我在 CLAUDE.md 文件里写了好几条规矩想解决这个问题，还是会出这种状况。

尽管有这么多毛病，整体上依然是巨大的进步，很难想象还要回去手写代码。

总结就是，每个人现在都在摸索自己的 workflow，我现在的配置是：左边开几个 Claude Code 的 session（用 ghostty 终端窗口或标签页），右边开着 IDE 看代码加手动改。

【拼劲儿】

看 AI 智能体不知疲倦地死磕一个问题，这事儿特别有意思。它们从不累，从不沮丧，从不心态崩了，就一直在那儿试来试去。换成人类早放弃了，改天再战了。看着它为了一件事挣扎半小时最后终于搞定，你会有一种"感受到 AGI（通用人工智能）临门一脚"的震撼。你会意识到，"耐力"其实是工作的核心瓶颈，而现在有了 LLM，这个瓶颈被大幅拓宽了。

【加速效应】

很难说 LLM 到底带来了多少倍"提速"。我当然觉得自己写东西比以前快多了，但主要效果其实是我干的事儿变多了，因为两点：
第一，以前觉得不值得花时间写的小工具小功能，现在都能随手让 AI 写了；
第二，以前因为知识或技能门槛碰都不敢碰的代码，现在也能上手了。

所以确实是提速，但更像是"业务扩张"——你能覆盖的疆域变大了。

【杠杆效应】
LLM 特别擅长一件事：循环迭代直到达成特定目标。这才是"感受到 AGI 魔法"的核心所在。别告诉它"怎么做"，告诉它"做成什么样算成功"，然后看它表演。
先让它写测试，再让它跑通测试；
把它跟浏览器 MCP（AI 操控浏览器的工具）连起来让它自己查资料；
先写个简单粗暴但大概率正确的算法，再让它在保证正确的前提下优化；
把你的思路从"命令式"（一步步指挥）改成"声明式"（描述目标），让智能体能循环跑更久，你就能获得更大的 leverage（杠杆效应）。

【好玩】
我没想到，用了智能体之后编程反而变得更有趣了。因为很多"填空题"式的枯燥重复劳动被干掉了，剩下的都是创造性部分。

我也不那么容易卡壳了（卡壳真的很难受），而且胆子变大了，因为无论遇到什么难题，基本上都能找到跟 AI 协作、逐步推进的办法。

当然我也听到过相反的声音：以后程序员会分化成两类，
一类是真心喜欢写代码 process（过程）的，
一类是喜欢 building（产出结果）的，

LLM 会让这两类人走向不同的方向。

【能力退化】

我已经开始注意到，自己手写代码的能力在慢慢退化。

"生成"（写代码）和"辨别"（读代码）是大脑里两套不同的能力。
主要是因为编程里有太多小的语法细节，你现在看代码还是能看懂，但真要自己从零写，可能会卡壳。

【垃圾内容末日】

我在为 2026 年做准备，我预感那一年会是"slopocalypse"（slop+apocalypse，垃圾内容大灾变）元年。
GitHub、Substack、Arxiv、X/Instagram 还有所有数字媒体都会被 AI 生成的低质量内容淹没。

我们还会看到更多 AI 炒作的生产力表演（虽然现在已经够多了），混在真正有价值的进步中间。

【一些问题】

脑子里有几个问题在转悠：
- "10倍工程师"这个概念会变成什么样？就是普通程序员和顶级程序员 productivity 的差距。很有可能这个差距会变得巨大无比。
- 有了 LLM，通才（generalist）会不会越来越 outperform（碾压）专才（specialist）？因为 LLM 特别擅长填 small gaps（微观细节），但不擅长 grand strategy（宏观战略）。
- 未来用 LLM 编程会是什么感觉？会像玩星际争霸？像玩异星工厂（Factorio）？还是像玩音乐？
- 整个社会有多少产业是被"数字知识工作"卡脖子的？

【太长不看版总结】

那我们到底在哪？Claude 和 Codex 这些 LLM 智能体的能力在 2025 年十二月左右跨越了一个"连贯性阈值"，在软件工程和相关领域引发了一场相变（phase shift）。智能这部分突然感觉领先了其他所有东西一大截——集成（工具、知识）、新的组织 workflow 需求、流程设计、能力扩散等等。2026 年会是高能的一年，整个行业都在消化这套新能力。

作者

Andrej Karpathy（安德烈·卡帕西），AI 圈尊称他为"卡帕西"或"K 神"，简单说就是当今世界最会教 AI 的 AI 大神。

卡帕西自曝：二十年编程流程，竟在数周内被Claude彻底翻转

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道