Claude Code新出的任务系统表面是个高级备忘录,内核却是能让多个AI代理并行干活、互相协调、还能记住状态的分布式大脑网络。
每个子代理独享20万token的上下文窗口,完全隔离不打架,依赖关系自动管理执行顺序,七到十个代理能同时跑,复杂项目从串行变并行直接提速几倍。
更狠的是这架构支持层层嵌套,代理还能再 spawn 自己的子代理,理论上可以无限分层。
这意味着写代码的核心技能正在从敲键盘转向清晰定义问题,一个人指挥AI军团就能干以前二十人团队的活,软件开发的门槛要塌了。
蜂群来了
我们这些搞技术的,念叨"智能体蜂群"(agent swarms)已经好几年了。啥意思呢?就是让一堆 AI 智能体一起协作,搞定复杂任务——有的负责 spawning(孵化)子智能体,有的管依赖关系,有的并行干活。演示的时候看着老帅了,结果真用到实际工作里,啪,全崩了。
这周我正在搞一个大型的身份认证重构(auth refactor),突然看到 Claude Code 的新任务系统上线了。我想试试它到底能扛多大事,就整了一个超级长的任务清单,让它调度子智能体去执行全部任务……结果它居然搞定了?
我觉得咱们刚刚跨过了一道坎,但大部分人还没意识到。
别光看表面
大多数人看到这个任务系统,心想:"哦,就是个新待办清单呗。"嗯……行吧,这么说也没错。但关键是,现在你的任务能扛住 /clear(清空对话),能扛住重启会话,而且如果你设置了 CLAUDE_CODE_TASK_LIST_ID 这个环境变量,哪怕关掉终端,任务都还在。
但大部分人看错了重点。
这个任务系统,本质上是个协调层(coordination layer)。它让多个智能体并行工作,追踪谁依赖谁,还能共享状态——这个状态不会因为某一次对话结束就消失。
这么想吧:以前,Claude 就像一个大脑,试图一次性把整个复杂项目塞进脑子里。现在 Claude 能把工作拆成小块,把这些小块丢给独立的智能体,每个智能体都有自己的"记忆空间"(上下文窗口),然后通过共享的依赖关系图来协调一切。这完全是两码事。
表面上看,Claude Code的新任务系统就像个普通的待办事项列表,用户输入一个大目标,AI自动生成一堆小任务,还能标记完成状态。
但真正改变游戏规则的,是这套系统底层的协调机制。
它不再依赖单一AI在有限上下文中硬扛整个项目,而是把工作拆解成独立单元,每个单元由一个专属子代理负责,每个子代理都拥有完整的20万token上下文窗口,彼此完全隔离。
这意味着处理认证逻辑的代理不会被数据库查询的细节干扰,写测试用例的代理也不会被前端样式污染思维。
这种隔离不是可有可无的优化,而是解决复杂工程中“上下文过载”问题的根本方案。
过去,AI在推进到第五步时常常忘记第二步的前提条件,导致整个流程崩盘;
现在,每一步都由专门的代理专注执行,上下文干净纯粹,错误率大幅下降。
更重要的是,这些任务之间通过“blockedBy”字段建立硬性依赖关系,比如任务3必须等任务1和任务2都完成后才能启动。
这种依赖不是建议,而是强制规则——系统根本不会允许任务3提前运行。
这样一来,整个执行流程被固化在结构之中,不再依赖AI的记忆力或用户的反复提醒。即使用户三天后重新打开终端,任务列表依然完整,进度一目了然,蜂群立刻接续工作。
这种持久化能力通过一个简单的环境变量实现:export CLAUDE_CODE_TASK_LIST_ID="my-project",所有任务数据就保存在~/.claude/tasks/my-project/目录下,跨会话、跨终端无缝延续。任务系统因此从临时备忘录升级为项目的持久状态机,成为蜂群协作的神经中枢。
任务系统到底在干嘛?
每个任务都能孵化出自己的子智能体,每个子智能体都有全新的 20 万 token 记忆空间,跟主对话完全隔离。这就是整个系统能跑起来的关键。
想想这种隔离能带来啥好处。智能体 1 在翻身份认证代码,脑子里建了一套完整的"用户会话怎么处理"的模型。智能体 2 在重构数据库查询,记着各种表结构细节。智能体 3 在改测试代码,追踪哪些断言要调整。它们互相不会污染对方的记忆,也不会被别人的工作搞懵——因为它们根本看不到对方。
这跟老办法天差地别。以前 Claude 试图在一个对话里记住所有东西。小项目还行,一旦复杂起来,你就撞墙了——Claude 得同时记住之前的决定、实现新功能、追踪改了哪些文件。记忆管理、记忆管理、记忆管理,重要的事情说三遍。东西总会漏掉。
有了任务系统,每个智能体只专注一件事。一个任务完成了,被它卡住的任务自动解锁,下一波工作自动启动。协调机制是系统内置的,不用 Claude 主动去管。
无名英雄:
blockedBy
json
{
"subject": "实现 JWT 身份认证",
"addBlockedBy": ["1", "2"]
}
这不是建议。任务 #3 literally(字面意义上)不能启动,除非任务 #1 和 #2 都完成了。系统不会让它跑,所以 Claude 不可能不小心跳过步骤,或者忘了前置条件——因为结构本身就在强制执行顺序。
没有依赖关系的时候,Claude 得把整个计划存在工作记忆里。小任务没问题,但复杂项目一旦 Claude 的记忆满了,或者你运行了 /clear,计划就开始崩。你得重新解释你要啥、做了啥、还剩啥、谁依赖谁。计划只存在于 Claude 脑子里,所以很脆弱。
有了依赖关系,你把计划外化成了一个结构。它能扛住记忆压缩、扛住会话重启、扛住你三天后再回来干活。这个图不会忘,也不会跑偏。它从来不需要被重新解释,因为它本来就不是存在记忆里的。
这就是为什么之前 Ralph 那么火,大家都在用它"重新锚定"(reanchoring)——让 AI 记住之前干了啥。Anthropic 这一下子把 Ralph 给干掉了。
以前 vs 现在
以前用 Claude Code 的流程是这样的:
1. 让 Claude 干个复杂的事
2. 看它大概完成 60%
3. 发现它干到第 5 步时,把第 2 步忘了
4. 运行 /clear,重来
5. 重复到崩溃
有了任务系统之后:
1. 让 Claude 拆解工作
2. 审一下任务图
3. 让它跑
4. 任务按顺序完成,因为系统只允许这个顺序
5. 结构保证正确性。依赖关系图存在于 Claude 的记忆之外,所以没啥可忘的。
并行狂魔
有件事我花了点时间才完全get到:你可以同时跑7 到 10 个子智能体。
想想这意味着啥——以前你给 Claude 一个 10 个任务的活儿,它会串行处理:任务 1,然后任务 2,然后任务 3……哪怕其中一半任务完全独立,谁先谁后都无所谓,Claude 还是得一个一个来,因为所有事都在一个对话线程里。
有了任务系统,Claude 看一眼依赖图,把所有能并行的任务全丢出去。任务 2、3、4 互不依赖?三个智能体同时启动,各自有独立的记忆空间,各自独立干活。你啥都没做,速度直接翻 3 倍。
孵化被卡住的任务
系统还会给每个活儿选合适的模型——Haiku 做快速搜索,Sonnet 写代码,Opus 处理需要深度推理的。你不用操心资源分配或成本控制,只要定义好依赖关系,系统自动搞定所有调度。
持久化:任务不会消失
设置一个环境变量:
bash
export CLAUDE_CODE_TASK_LIST_ID="my-project"
现在你的任务存在 ~/.claude/tasks/my-project/ 里。明天开新会话,任务还在。换个终端,同一个任务列表。多个 Claude 会话同时干一个项目,都能看到并更新同样的任务。
这对长期工作来说就很有意思了。跨度几天的重构、断断续续开发的功能……任务图变成了项目的持久状态,独立于任何对话。
我开始把任务列表当成大项目的"唯一真相源"。不用每次回来都重新解释一遍,我让 Claude 查任务列表,看看上次干到哪了。结构把上下文往前带。
上手很简单
1. 让 Claude 干个复杂的事
2. 如果它自动创建了任务,让它跑
3. 如果没有,告诉它"把这个拆解成带依赖关系的任务"
4. 按 Ctrl+T 看任务视图
5. 看它干活
想要持久化,加这行到你的 shell 配置文件:
bash
export CLAUDE_CODE_TASK_LIST_ID="你的项目名"
就这些。系统负责调度、并行化、依赖追踪。
依赖图谱:让AI不再“健忘”的外部记忆体
在传统模式下,AI处理复杂任务时,整个计划都存储在它的对话上下文中。一旦上下文被清空(比如用户输入/clear),或者会话超时重启,所有进度、决策和未完成项都会丢失。用户不得不重新解释“我们做到哪了”“哪些完成了”“下一步该做什么”,效率极低且容易出错。
而新任务系统通过将依赖关系外化为结构化数据,彻底解决了这个问题。
每个任务以JSON格式定义,其中“addBlockedBy”字段明确列出前置任务ID。例如:
{ |
这段代码意味着“实现JWT认证”任务必须等待ID为1和2的任务全部完成。系统在调度时会严格检查这一条件,不满足则绝不启动。
这种机制把原本存在于AI“脑海”中的计划,转化为存在于文件系统中的客观事实。计划不再脆弱,不会因上下文压缩而模糊,不会因时间推移而遗忘。
即使用户一周后回来,蜂群也能通过读取任务文件准确还原项目状态。
这种外部记忆体的设计,本质上是一种“元认知架构”——它不依赖模型内部的推理能力来维持任务连贯性,而是通过外部结构强制保证执行顺序。
这正是过去所谓“Ralph重锚定”试图解决的问题,而Claude Code直接用任务系统终结了这一痛点。
依赖图谱不仅确保顺序正确,还天然支持并行执行:只要多个任务没有相互依赖,系统就会同时启动多个子代理并行处理。比如任务2、3、4彼此独立,蜂群会一次性派出三个代理同时开工,效率提升三倍。这种并行不是靠AI“想起来”可以并行,而是由依赖图谱的拓扑结构自动决定,从根本上改变了任务执行的范式。
并行蜂群:十倍速开发的秘密武器
过去,即使面对十个完全独立的子任务,AI也只能按顺序一个一个处理,因为所有操作都发生在同一个对话线程中。这种串行模式严重限制了效率,尤其在大型重构或全栈开发中,大量时间被浪费在等待上。
而新任务系统彻底打破了这一限制。系统在解析任务依赖图后,会自动识别所有“就绪”任务——即所有前置条件已满足的任务——并为每个就绪任务启动一个独立的子代理。这些子代理同时运行,各自拥有专属的20万token上下文,互不干扰。
实测中,蜂群可同时维持七到十个子代理并发工作。
这意味着,如果一个项目包含十个无依赖的模块,开发速度理论上可提升十倍。
更妙的是,系统还会根据任务类型自动选择最合适的模型:快速搜索用轻量级的Haiku,常规编码用平衡型的Sonnet,复杂推理则调用高性能的Opus。
用户无需操心资源分配或成本控制,只需定义任务和依赖,蜂群自动完成最优调度。
这种智能并行不仅加速执行,还提升了质量——每个代理专注单一领域,上下文更聚焦,出错概率更低。当某个任务完成,系统会立即检查是否有其他任务因此解除阻塞,并自动触发下一波并行执行。
整个流程如多米诺骨牌般自动推进,用户只需在开始时设定目标,中间偶尔审查任务图,最后验收成果。这种“设定-放手-收获”的模式,让开发者从执行者转变为指挥官,真正实现了“用脑力代替体力”。
第二层:子智能体也能当爹
现在你让 Claude 当主智能体。你给它一个复杂任务,它拆解工作,创建依赖图,孵化子智能体去处理各个部分。这就是我们刚才聊的。
但这些子智能体本质上也是 Claude 实例,有自己的记忆空间。它们为啥不能用同样的任务系统呢?
顺着这个思路想一秒。
你让 Claude 重构整个代码库。它拆成子系统——身份认证、数据库、API 路由、前端、测试。孵化五个子智能体。
现在身份认证智能体一看,自己的活儿还挺复杂。于是它进一步拆解——登录、登出、会话管理、密码重置、Token 刷新。创建自己的依赖图。孵化自己的子智能体。
你现在到了第三层。而且第三层没啥能阻止它孵化第四层。这个架构没有内置天花板——唯一的限制是管理记忆和成本,不是能力。
我们现在在第二层。但往更深走的脚手架已经搭好了。
三层嵌套:蜂群还能生蜂群
当前版本的任务系统已支持两层代理结构:主代理负责整体规划,子代理负责具体执行。但架构设计本身并未限制深度,理论上可无限嵌套。
想象这样一个场景:用户要求重构整个代码库。主代理首先将其拆分为五大模块——认证、数据库、API路由、前端、测试,并为每个模块启动一个子代理。
这时,认证子代理发现自己的任务仍然过于复杂,于是它再次调用任务系统,将“认证”进一步拆解为登录、登出、会话管理、密码重置、令牌刷新五个子任务,并为每个子任务再启动一层子代理。此时,系统已进入第三层:主代理 → 模块代理 → 功能代理。
而第三层的每个功能代理,同样可以继续拆解,形成第四层。
这种递归式分层能力,使得蜂群能处理任意复杂度的工程。每一层都遵循相同的协调原则:依赖图谱控制顺序,并行执行提升效率,上下文隔离保证专注。
虽然目前实际使用多停留在两层,但底层架构已为深度嵌套铺平道路。唯一限制来自成本和上下文管理的实际考量,而非技术天花板。
这种可扩展的层级结构,正是“代理蜂群”概念的核心体现——不是多个AI简单并列,而是形成具有组织结构的智能网络,每一层都能自主决策、自主分解、自主协调。未来,随着模型能力增强和成本下降,三层甚至四层蜂群将成为常态,一个人指挥的蜂群规模可能相当于一个小型软件公司。
这一体系的独特性体现在三点:上下文隔离作为一等公民,依赖结构作为执行约束,任务状态作为持久化事实。三者组合后,智能体协作首次摆脱记忆脆弱性,进入工程级稳定运行区间。这种架构此前多停留在理论与演示阶段,此次呈现出可落地、可扩展、可递归的完整形态。
软件开发要变天了
我一直在想这对整个软件开发意味着啥。
几十年来,核心技能是写代码。后来变成架构设计。再后来变成协调团队。每一层都是更高的抽象,但基础没变——总得有人写实际代码。
这个基础正在动摇。
再过几年,也许更短,主要技能不会是写代码,甚至不是架构设计。而是把问题定义得足够清楚,让智能体蜂群能解决它。你的工作变成:知道要造啥、为啥重要、成功长啥样。具体实现——重构、测试、调试、跨服务协调——层层下放给智能体。
这不是"AI 取代开发者"——这种 framing 没 get 到点。角色只是又往上抽象了一层,跟过去几十年一样。你变成了协调层级的顶端,能执行的规模放在不久前需要 20 个人。
有件事让我睡不着觉:谁先搞明白这个,谁就会拥有难以想象的杠杆。
现在你想搞个有野心的东西,需要融资、组团队、几个月的跑道。很快你只需要一张信用卡,加上能把需求描述清楚的能力,让智能体去执行。造软件的门槛正在崩塌——不是那种"人人都会编程"的说法,那一直是扯淡,因为大多数人根本不想写代码。这次不一样。这次门槛是为那些"知道要造啥但不想自己花六个月动手"的人崩塌的。
那是另一个世界。
我不确定具体会怎么展开。但我敢赌,三年后,有人能在一个下午发布一个生产级应用,而今天需要一个团队干六个月。可能有些瓶颈我还没看到,但方向是明确的。
结语
我们念叨智能体蜂群好几年了。这是我第一次看到架构在实战中真的跑起来。
任务系统看着像个待办清单,但底下跑的是分层多智能体系统的协调层。清单只是界面。
你不再是在管理任务了。你是在指挥一个蜂群。
Claude Code任务系统通过依赖图谱、上下文隔离与持久化存储,实现多层AI代理蜂群协同,使复杂软件开发可并行、可嵌套、可延续,彻底改变人机协作范式。