复刻Manus 20亿上下文工程模式:三份Markdown文件让Claude永不失目标


开源项目planning with files复刻Manus价值20亿的上下文工程模式,通过三文件系统解决LLM长任务失忆症,实现可靠复杂的AI代理工作流。

Manus 20亿美元收购背后的AI工作流秘密:三份Markdown文件让Claude永不遗忘目标

一个价值20亿美元的AI工作流秘密,现在免费开源了!

让Claude帮你写一本技术手册,结果做到一半它突然开始写诗歌;让你调研TypeScript的优势,结果第五轮工具调用后它完全忘了最初目标是什么;更离谱的是,明明上一步刚失败过,它下一秒又用同样的方式重蹈覆辙——这不是模型笨,而是所有大语言模型都面临的致命短板:上下文记忆太短、目标容易漂移、错误无法沉淀。

就在2025年12月29日,Meta以20亿美元天价收购了一家成立仅8个月的AI代理公司Manus,这家公司从零做到年收入超1亿美元,靠的不是什么黑科技,而是一种被他们称为“上下文工程”(Context Engineering)的朴素方法论。

如今,这套曾让Manus估值飙升的核心工作流,被一位名叫艾哈迈德·奥斯曼·阿马尔·阿迪(Ahmad Othman Ammar Adi)的开发者完整复刻,并以MIT开源协议发布为Claude Code插件——planning with files。这个项目上线不到24小时就引爆社区,GitHub星标迅速突破5400+,无数开发者惊呼:“终于有人解决了LLM长任务失忆症!”

Manus凭什么值20亿美元?答案藏在三份Markdown文件里

很多人以为Manus的成功源于某种神秘算法或独家训练数据,但深入拆解后你会发现,它的核心秘密极其简单:把文件系统当作AI的外部硬盘记忆

Manus内部有一句信条:“Markdown就是我在磁盘上的工作记忆。”

由于大模型的注意力窗口有限,无法在数十次工具调用后仍牢牢抓住初始目标,Manus的做法是强制AI将关键信息实时写入持久化文件,而非依赖易挥发的对话上下文。具体来说,每个复杂任务必须创建三个标准化文件:

  1. task_plan.md用于记录目标、阶段划分、当前进度和错误日志;
  2. findings.md专门存储研究发现、网页抓取内容和中间结论;
  3. progress.md则作为操作日志,记录每一步执行细节和测试结果。

这种设计看似原始,却精准击中了当前AI代理的四大痛点:上下文重置导致记忆清零、长链路任务目标漂移、失败经验无法复用、以及为塞进更多内容而疯狂堆砌提示词造成的“上下文膨胀”。

通过让AI在每次重大决策前重新读取task_plan.md,Manus确保了即使经过50次以上工具调用,原始目标始终处于模型的注意力焦点内——这正是它能稳定完成复杂商业任务的关键。

planning with files:把Manus模式变成你的Claude超能力

艾哈迈德·奥斯曼并非无名之辈,他长期深耕AI代理工作流优化领域,对Anthropic的Claude Code框架有深刻理解。

他敏锐意识到,Manus的“上下文工程”本质是一种可复制的架构模式,于是耗时数周逆向还原其核心逻辑,并封装成即插即用的技能包。

安装过程极其简单:只需将GitHub仓库克隆到本地Claude技能目录(macOS/Linux路径为~/.claude/skills/,Windows为%USERPROFILE%\.claude\skills\),重启Claude Code后,该技能便会自动激活。

当你发起多步骤任务、提及“规划”“追踪进度”或请求结构化输出时,Claude会立即创建那套标志性的三文件体系。例如你输入“调研TypeScript的优势并撰写总结”,Claude首先生成task_plan.md,清晰列出四个阶段:创建计划、收集资料、整合发现、交付摘要,并用复选框标记当前所处环节。随后它执行网络搜索,将所有有用信息存入findings.md而非塞进对话历史,每完成两个浏览器操作就强制保存一次——这就是所谓的“两操作规则”(2-Action Rule)。

当进入撰写阶段,它会先读取findings.md中的全部素材,再结合task_plan.md的进度状态生成最终报告,最后更新所有文件状态为完成。整个过程如同一个严谨的项目经理,每一步都有迹可循。

技术细节揭秘:PreToolUse钩子如何锁死目标不漂移

planning with files v2.0版本的最大突破在于引入了精密的钩子(Hook)机制。

其中最关键的PreToolUse钩子会在每次调用Write/Edit/Bash等核心工具前,强制Claude重新加载task_plan.md的内容。这意味着无论对话历史多么冗长,模型在做关键决策时总能“刷新”原始目标到当前上下文窗口。

想象一下,当AI即将执行第47次代码修改时,它会先暂停动作,读取task_plan.md中“Phase 3: 实现用户认证模块”的明确指令,从而避免因上下文污染而误入无关功能开发。另一个Stop钩子则在任务结束前进行完整性校验:只有当task_plan.md中所有阶段的复选框都被勾选,且错误日志区无未处理异常时,才允许终止任务。

这种双重保险机制彻底杜绝了“半成品交付”问题。此外,项目还内置了带详细注释的模板文件,每行代码旁都标注了“做什么”“为什么这么做”“何时触发”,极大降低了新手学习门槛。v2.0.1新增的“构建待办事项应用”完整示例更是手把手演示了从需求分析到部署测试的全流程,连调试技巧和常见陷阱都一一罗列,堪称AI工程化实践的教科书级案例。

为什么这套模式能解决LLM的先天缺陷?

大语言模型本质上是一个强大的模式匹配引擎,但它缺乏人类那种持续的目标导向性和错误反思能力。

传统做法试图通过不断延长上下文窗口来解决问题,但这不仅成本高昂,还会因信息过载导致性能下降。planning with files另辟蹊径,将认知负荷从模型内部转移到外部文件系统——这恰似人类使用笔记本记录待办事项:我们不会把所有计划塞进大脑短期记忆,而是写在纸上随时查阅。

这种“外脑”设计完美规避了LLM的三大硬伤:
首先,文件持久化解决了上下文重置导致的记忆丢失;
其次,结构化阶段划分配合进度复选框,使目标状态可视化,有效对抗目标漂移;
最后,所有失败尝试都会被记录在task_plan.md的错误日志区,下次执行时AI会主动规避相同陷阱。

更妙的是,这种模式天然支持任务中断与恢复——今天做到一半关机,明天打开文件就能无缝续接,因为所有状态都已固化在磁盘上。对于需要跨天甚至跨周完成的复杂项目(如撰写技术书籍、开发全栈应用),这种可靠性提升是革命性的。

实战场景:从技术调研到产品开发的全流程覆盖

这套工作流的价值在真实场景中尤为突出。

假设你要开发一个天气预报应用,传统方式下Claude可能在API集成阶段突然跳去设计UI配色方案。而启用planning with files后,流程将严格遵循task_plan.md的指引:

  1. Phase 1定义核心功能(获取实时天气、展示7天预报);
  2. Phase 2调研OpenWeatherMap API文档并将关键参数存入findings.md;
  3. Phase 3编写前端代码时,progress.md会逐行记录组件构建过程;若某次API调用失败,错误详情立即写入task_plan.md的“已知问题”区块。
  4. 当进入Phase 4测试环节,Claude会对照progress.md的操作日志逐一验证功能点,确保无遗漏。

同样适用于学术研究:
撰写论文时,findings.md积累所有参考文献摘要,task_plan.md跟踪章节完成度,避免重复劳动。甚至内容创作领域也能受益——写小说时用progress.md记录角色设定演变,task_plan.md管理章节大纲,彻底告别“写到第三十章忘记主角动机”的尴尬。

任何涉及三步以上、需跨工具协作或历时较长的任务,都是这套模式的绝佳用武之地。

开源生态的力量:MIT协议下的无限可能

艾哈迈德选择以MIT许可证开源该项目绝非偶然。这种极度宽松的授权允许任何人自由使用、修改甚至商用代码,极大加速了模式的普及。社区已涌现出大量衍生实践:有人将其适配到GPT Engineer框架,有人集成进AutoGen多智能体系统,还有团队基于此开发了可视化任务看板工具。GitHub仓库的贡献指南鼓励开发者通过Fork-Branch-Pull Request流程提交改进,目前已合并多个重要PR,包括Windows路径兼容性修复、中文注释支持、以及与VS Code任务终端的深度集成。这种开放协作精神正是Manus理念的延续——真正的智能不在于封闭的模型,而在于可共享、可组合的工作流架构。正如艾哈迈德在README中所言:“如果这个技能能帮你更聪明地工作,那就是我全部的期待。”这种去中心化的创新模式,或许比20亿美元收购本身更值得深思。

给开发者的行动指南:三步开启结构化AI工作流

想要立刻体验这套价值20亿美元的工作流?

只需三步:第一步,打开终端执行git clone https://github.com/OthmanAdi/planning-with-files.git;
第二步,将下载的文件夹移动到Claude Code技能目录(路径见前文);
第三步,重启Claude并输入一个多步骤指令,比如“分析React与Vue的差异并生成对比报告”。你会亲眼见证Claude自动生成三份文件:task_plan.md列出调研、对比、撰稿三阶段;findings.md实时填充技术文档摘录;progress.md记录每次分析进展。

过程中若遇网络错误,task_plan.md会立即追加“[ERROR] 无法访问vuejs.org - 尝试备用源”,下次执行时自动切换策略。建议首次使用时参考项目内的Quick Start指南和Todo App示例,它们用最接地气的方式展示了从零到一的完整闭环。记住核心原则:永远让文件成为你的第二大脑,而非依赖AI的瞬时记忆。

上下文工程将重塑AI代理范式

Manus被高价收购绝非偶然,它标志着行业共识的转变——下一代AI竞争不在模型参数规模,而在任务执行架构。planning with files这类“外部元认知结构”正是Justin Wetch等前沿实践者倡导的方向:通过智能的外部框架弥补模型内在局限。当计算机学会像人类一样使用文件系统管理认知负荷时,AGI的实现路径将豁然开朗。

年轻一代开发者正快速内化这种“代理式工作流”,他们不再把AI当作问答机器,而是具备持久记忆与反思能力的数字同事。