OpenClaw通过CLI绕过Claude API限制新玩法曝光

#OpenClaw #OpenCode #生产力黑客 #AI智能体Agent

2026-04-07 1 5K banq

Reddit有用户发现Claude Code CLI可作为独立产品绕过API限制，用小型模型当秘书调度，大模型只干重活。这个架构分离了路由与执行，保留了工具调用能力，但丢失了OpenClaw原生的上下文注入，不适合当全能管家。

Anthropic官方封杀了OpenClaw使用Claude订阅的权利，龙虾社区哭成一片。但是这帮人转头就发现了一个漏洞：Claude Code CLI是一个独立产品，跟API限制完全没有关系。

于是他们搞出了一套骚操作——绕过API，直接调用CLI。

小型模型当秘书接电话，只负责判断“这活儿该找谁”，真正干活的时候才把Claude Code这个大牛请出来。
这就好比公司前台小妹只会转接电话，但真正写代码的还是那个月薪五万的架构师。

整个架构的核心逻辑就是任务分发：秘书模型不需要多聪明，Haiku、GPT-5.4-mini、Qwen3.5甚至本地跑的小模型都行。它只干一件事：看用户说了什么，然后决定这个任务是交给Haiku这种便宜模型干杂活，还是交给Opus 4.6这种顶级模型写复杂代码。

工具调用方面，如果工具在CLI的工作区里，就能正常返回结果，只是CLI自己会在一个回合后压缩工具调用的细节。

如果你想要完整的、持久化的工具返回，那就直接在OpenClaw内部写自定义工具，这样控制权完全在自己手里。

秘书接电话，老板只写代码

这个架构最逗的地方在于它完美利用了人的懒惰心理和AI的定价策略。

Claude直接调API贵得离谱，就像你打车从北京到上海，每公里计价器跳得你心慌。但是Claude Code CLI是月付制，相当于你买了张月票，随便坐。

OpenClaw本身就是一个智能路由器，它不需要自己多聪明，它只需要知道哪个模型便宜、哪个模型能干重活。

于是这帮人让Haiku这种便宜模型当秘书，所有用户消息先经过秘书。秘书一看，“哦，这人问今天天气怎么样”，那就自己用Haiku回了，成本几分钱。秘书再看另一条消息，“帮我重构这个三千行的微服务”，秘书立刻转给Claude Code CLI，“老板，这活儿我干不了，您来”。这就像公司前台月薪三千，只会说“您稍等我转接一下”，然后CEO出来解决问题。CEO不会觉得前台抢了活儿，前台也不会觉得自己能写代码。各司其职，完美。

这里有一个细节特别值得笑。

秘书模型虽然便宜，但它接收到的消息里其实包含了OpenClaw注入的所有上下文——什么SOUL.md、IDENTITY.md、AGENTS.md、记忆文件、对话历史，一大堆。但是秘书模型根本看不懂这些东西，它只知道“哦，有一条消息进来了，我看看关键词，嗯，有‘代码’两个字，转给Claude Code”。然后它把原始消息转发给CLI，自己完全不理解那些复杂的人格设定和记忆上下文。

这就好比你给前台小妹一份公司十年战略规划书，说“你读一下，然后有人打电话来你就知道怎么转了”。小妹翻了翻，“这啥玩意儿，我就记住‘代码’和‘天气’两个词就行了”。

结果就是，Claude Code CLI那边收到的只是一条干巴巴的“帮我写个登录页面”，完全不知道你之前跟Enzo聊了半小时的背景、你的项目结构、你的cron任务、你的活跃Agent列表。CLI能读文件，但它不会主动去读。它就像一个被临时叫来的外包程序员，你只丢给它一句话，它只能按这句话干活，不会自动翻你整个项目的家底。

工具调用的坑和绕过去的办法

关于工具调用，这个问题问得很专业。

CLI有自己的脾气，它工作区里的工具确实可以调用，也能拿到返回结果。但是CLI有个让人抓狂的习惯——它会在一个回合后自动压缩工具调用的细节。也就是说，你第一次调用工具拿到了结果，下一轮对话的时候CLI可能只记得“哦，之前调了个工具，结果大概是好的”，具体返回了什么数据它就不详细说了。这就好比你让秘书查一下明天航班，秘书告诉你“有票”，第二天你再问“几点的航班”，秘书说“我昨天不是告诉你有票了吗”。你气得想打人，但秘书觉得自己逻辑没毛病。

解决办法其实就在OpenClaw自己身上。你完全可以在OpenClaw内部写自定义工具，这些工具的返回是完整且持久的，你可以完全控制它们的行为。

也就是说，CLI只负责它擅长的代码生成和文件操作，而任何需要记住、需要多轮对话保持状态的事情，都交给OpenClaw自己的工具系统。

这就好比公司里，CLI是那个写代码但记性差的程序员，OpenClaw是那个记性好但不会写代码的项目经理。项目经理说“你去写个登录页”，程序员写完了，项目经理把结果记在本子上。下次客户问“上次那个登录页的验证逻辑是什么”，项目经理翻本子就能回答，不用再去问那个已经忘了的程序员。

路由模型的分离策略和性能感受

有人问延迟会不会变高。答案是完全没区别。因为秘书模型本身特别快，它只做关键词匹配和路由判断，不生成复杂内容。就像你打电话到总机，总机转接的时间可能只有零点几秒，你根本感觉不到。

真正耗时的部分是Claude Code CLI干活的时候，这部分时间跟你直接调API是一样长的。所以整体体验没有下降，但成本可能只有原来的十分之一甚至更低。

更骚的是，你可以把路由模型保持轻量上下文。也就是说，秘书模型每次只看到当前这条用户消息的关键信息，不会把整段对话历史都塞给它。这样做的好处是秘书不会“看多了变傻”——它本来就傻，但你至少不会让它更傻。而且秘书的决策不会被之前的对话污染，它每次都重新判断“这条消息该给谁”。这就好比前台每次接到电话都只看今天的来电显示，不去翻你昨天跟谁吵过架。干净利落，不会因为昨天你骂了客服今天就故意把你的电话转接到投诉部门。

这个架构适合什么、不适合什么

这个架构最适合的场景是任务分发。比如你有一堆杂活——整理日志、格式化代码、跑测试、生成文档，这些都交给Haiku或者GPT-5.4-mini这种便宜模型。然后遇到真正的硬骨头——写核心算法、重构架构、调试复杂bug，才让Claude Code CLI出手。这就好比一个工地上，搬砖的小工一天两百，砌墙的师傅一天两千。你不可能让师傅去搬砖，也不可能让小工去砌承重墙。各干各的，总成本最低。

但是这个架构绝对不适合当你的“全能管家”。原来OpenClaw里的Enzo是一个上下文极其丰富的助手，每次对话都会注入SOUL.md、IDENTITY.md、AGENTS.md、记忆文件、对话历史、cron任务状态、活跃项目信息。Enzo知道你昨天干了什么、你的项目结构、你的习惯、你的偏好。它就像一个跟了你五年的私人秘书，你一个眼神它就知道你要什么。但是当你用便宜秘书模型做路由的时候，这个秘书模型根本看不懂那些上下文，它只转发原始消息。

于是Claude Code CLI那边收到的就是一个光秃秃的问题，没有任何背景信息。CLI能读文件，但它不会主动去读你所有的项目文件、记忆文件、Agent配置。它就像一个新来的实习生，你只说“帮我改一下代码”，它不知道你要改哪个文件、改什么、为什么改。它能干活，但需要你把所有信息都喂到嘴边。

所以这个架构的正确用法是：把Claude Code CLI当成一个纯粹的执行者，而不是一个上下文丰富的决策者。你给它明确的任务、明确的输入输出格式，它执行完返回结果。所有需要记忆、需要上下文理解、需要多轮协调的事情，都放在秘书模型或者OpenClaw自己的工具系统里。这就好比军队里的指挥官和士兵。指挥官（秘书模型）知道整个战场的局势、友军位置、敌军动向、战略目标。

士兵（Claude Code CLI）只需要知道“三点钟方向有一个敌人阵地，你去炸掉它”。士兵不需要知道为什么要炸、炸完之后谁接应、旁边的山头上是不是有自己的侦察兵。士兵只需要执行命令，然后回来报告结果。指挥官根据结果再决定下一步。这样既发挥了Claude Code CLI的代码能力，又避免了它记性差、上下文丢失的问题。

社区反应和实操反馈

帖子下面有人已经跑通了这套方案，反馈说“我觉得跑得不错”。但也有人遇到了问题，朋友安装后Claude自己跳出来一段话，说这个便宜秘书方案会丢失什么。

Claude说得特别直白：你会丢失Enzo的人格、丢失注入的上下文、丢失记忆。原来的Enzo每次对话都带着全套设定文件，它知道自己的身份、知道你是谁、知道你项目的所有细节。便宜秘书模型拿到这些上下文后根本看不懂，它只会贴一个“[routing: general]”标签，然后把原始消息扔给CLI。CLI那边看到的就是一句干巴巴的话，完全不知道你之前跟Enzo聊了什么、你的项目里有什么cron任务、你有哪些活跃的Agent。

这就像你本来有一个跟了你十年的老管家，他知道你每天早上喝什么咖啡、你的狗叫什么名字、你岳母的生日是哪天。你突然换了一个临时工，你跟临时工说“帮我安排一下今天的行程”，临时工转头对老管家说“他说安排行程”。老管家问“具体什么行程？跟谁？几点？在哪里？”临时工说“我不知道啊，他就说了这一句”。然后老管家只能根据自己记忆中你上周的行程来猜，大概率猜错。所以这个架构绝对不是“Enzo的平替”，它是一个完全不同的东西。Enzo是一个需要全局上下文的CEO助理，而这个架构是一个只需要执行具体命令的任务分发系统。你不能让分发系统去当CEO助理，就像你不能让前台去当COO一样。

最后总结一句大实话：这个架构聪明在利用了Claude Code CLI的独立性，绕过了API限制，用极低成本实现了任务分发。但它不适合需要深度上下文、多轮记忆、复杂人格设定的场景。选哪个方案，取决于你到底是要一个“能写代码的便宜工具”，还是一个“知道你所有秘密的AI管家”。两者不可兼得，除非你自己写一套能把上下文完整传递给CLI的中间层。但那又回到了原点——你为什么不直接用API呢？哦对，因为API贵。哈哈哈，这就成了一个死循环，但至少龙虾社区找到了一个能跑通的野路子。

代码仓库和作者说明

原帖作者贴出了项目地址：https://github.com/samwalter2949348803-stack/Openclaw-catch-Claude-Code.git。这个仓库里实现了上述的秘书路由架构。作者自己也承认，这个方案适合任务分发，不适合当全知全能的管家。

如果你想要完整的工具返回和持久化的状态管理，建议在OpenClaw内部写自定义工具，而不是完全依赖CLI的工具调用机制。

OpenClaw通过CLI绕过Claude API限制新玩法曝光

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道