本次OpenClaw v2026.3.2围绕实时流式预览、ACP子智能体默认启用、原生PDF工具上线与Zalo插件重构展开,全面提升智能体并行能力、文档处理效率与云端部署稳定性,整体架构迈向更自动化与工程化阶段。
OpenClaw开始边想边说,子智能体满地跑
OpenClaw刚放出了v2026.3.2版本,表面上看是修修补补,实际上是架构思路的大换血。这一版里,Telegram开始默认玩流式输出,ACP子智能体默认开启,原生PDF工具直接塞进内核,Zalo插件还被重写成了纯JavaScript。开发团队甚至还皮了一下,补了一句“Sleep is a feature we haven't shipped yet”,翻译过来就是“睡觉?那功能我们还没发货”。
什么意思?意思就是这玩意儿现在开始24小时连轴转,比你高中班主任还拼。
以前我们用智能体,就像带一个助理,你问它一个问题,它得想半天,然后憋出一段话丢给你。
现在的OpenClaw呢?像一个指挥中心,你发一个任务出去,它一边跟你唠嗑,一边在后台默默分派任务,调工具、查资料、读PDF、发消息,全程自动化,完全不用你操心。
听上去是不是有点像科幻片?其实全是工程能力的堆叠。
Telegram Live Streaming:智能体开始边想边说
这一版最扎眼的变化,就是Telegram默认开启了部分流式输出。
新建Telegram配置之后,默认会用sendMessageDraft这个接口进行私聊预览流式推送。啥意思?以前你发个消息过去,智能体得把整段话想完了,一次性发给你。现在不一样了,它一边想一边打字,你这边看着对话框里的字一个接一个蹦出来,那种感觉就像跟一个真人聊天,甚至比真人还快。从流程上讲,用户发消息进来,模型开始生成token,系统不等完整response,直接通过sendMessageDraft把正在生成的文本推到Telegram私聊窗口。这种partial streaming模式带来两个肉眼可见的好处:第一,响应速度直接起飞,你还没打完下一句,它已经开始回你了;第二,你能实时看到它推理的过程,看到它在想什么,而不是面对一个黑盒等半天最后蹦出一段可能跑偏的内容。
这里面的技术含量可不低。流式输出意味着系统要处理半成品文本,要管理草稿状态,要保证最后完成的时候能覆盖或者确认草稿内容。换句话说,通信层和生成层不再是各玩各的,而是深度耦合在一起。以前叫“等结果”,现在叫“持续交互”。给中学生打个比方吧:以前老师批作业,改完一整本才发下来。现在老师改一页发一页,你坐在教室后排,眼睁睁看着红笔一行行出现,那种心跳加速的感觉,懂了吧?这种体验直接改变你对智能体的认知。它不再是黑盒,而是一个正在动脑子的人。
ACP Subagents Everywhere:主智能体开始分身术
第二个重磅更新,是acp.dispatch.enabled=true默认开启。
这个参数的名字又臭又长,但背后的含义很简单:Agent Client Protocol子智能体现在默认可用。主协调智能体(CEO)可以自动生成(委托)后台子智能体去做并行任务。这不是小打小闹,这是架构级别的进化。以前你想做并行任务,得手动配置一堆流程,或者写一套复杂的工具链。现在好了,主智能体自己就能判断任务复杂度,然后自动派生子智能体去处理那些慢工具、资料检索或者长耗时计算。
流程上是这样的:用户发起一个任务,主智能体先分析任务结构。如果判断某部分适合并行处理——比如同时检索几个不同的资料库,或者调用几个耗时的API——就直接通过ACP协议生成子智能体实例。这些子智能体在后台独立运行,主智能体继续跟你聊天。等子任务完成,结果自动回传整合,全程无感。这就是典型的orchestration模式升级。主智能体负责决策,子智能体负责执行。听起来像啥?像公司架构对吧?老板开会,部门主管分别去执行,再回来汇报结果。
这里的爆点在于“默认开启”这四个字。默认意味着官方已经测试稳定了,不是拿用户当小白鼠的实验特性。这也意味着OpenClaw正在朝真正的智能体平台演进,而不再是单一模型的封装器。可以这么理解:以前的OpenClaw是个单打独斗的超人,现在的OpenClaw是超人带着正义联盟。你发一个任务,它直接呼叫闪电侠、神奇女侠、蝙蝠侠分头行动,最后汇总结果给你。这种并行能力,才是智能体真正的未来形态。
Native PDF Tooling:文档处理进入内核层
原生PDF工具上线,这绝对是很多人盼星星盼月亮等来的功能。
以前想解析PDF,要么依赖第三方插件,要么调用外部服务,麻烦不说,还不稳定。现在好了,内建工具直接支持解析、搜索、抽取表格,而且跑在sandboxed workspace里,安全又干净。流程变化非常清晰:你上传一个PDF,系统把文件放进沙箱目录。智能体调用内置pdf工具,解析文档结构,建立文本索引,识别表格区域,然后执行搜索或者提取操作。整个过程都在OpenClaw控制范围内完成,没有任何中间商赚差价。
这一步解决了什么核心问题?稳定性和一致性。第三方插件往往依赖系统环境或者外部二进制,部署到Railway、Render这种云环境的时候,动不动就踩坑。原生实现让运行环境高度统一,部署起来像喝水一样简单。对咱们学生党来说,这意味着啥?想象一下,你要分析一篇几十页的英文论文,以前智能体可能只能读纯文本,遇到图表就抓瞎。现在呢?直接抽取表格、定位段落、做关键词搜索,相当于给智能体装上了一个真正的阅读器。你可以让它“把第三页的表格提取成JSON”,或者“找出所有提到‘神经网络’的句子”,它都能秒回。
技术含义再往深了说一层:文档工具进入核心层,意味着OpenClaw开始重视“长期知识处理”。智能体的价值不在于陪你闲聊,而在于处理复杂结构化的资料。PDF工具就是迈向企业级应用的关键一步。你想啊,以后写论文、查文献、整理资料,直接扔给OpenClaw,它帮你读、帮你总结、帮你提取数据,你只需要躺着等结果,这不比你自己熬夜啃论文香多了?
Zalo Rebuilt in JS:云部署友好度大升级
Zalo Personal插件@openclaw/zalouser被完全重写为纯JavaScript实现。
这个改动听起来有点无聊,对吧?不就是改个语言吗?实际上,这一刀砍下去,解决的是部署层的老大难问题。以前那个版本依赖外部的CLI二进制文件,云平台环境千奇百怪,依赖系统级组件的时候,部署过程就像开盲盒,谁也不知道会不会翻车。现在纯JS实现意味着什么?只要Node.js环境存在,就能跑。依赖关系变得极其干净。
流程变化非常直接:安装依赖,加载插件,完成登录流程,没有额外的二进制下载,没有系统路径配置,没有任何黑箱操作。这种架构选择对Railway、Render这些PaaS平台极其友好。你可以一键部署,再也不用手动装依赖、配环境、调路径。这类重写背后体现的是一种工程哲学:尽量减少外部依赖,提高可移植性。智能体平台真要扩张规模的时候,部署便利性决定了使用门槛。如果每次部署都要折腾半天,谁还愿意用?把智能体比作一辆车,以前你得自己装发动机,现在开箱即用,踩油门就走。体验层面的差距,会迅速放大用户规模。
“Sleep” Feature:一句玩笑背后的真实需求
开发团队那句“Sleep is a feature we haven't shipped yet”听起来像在玩梗,实际上点出了社区长期关注的核心问题:持久化状态管理。
OpenClaw智能体是active agent模型,任务持续运行,子智能体并行执行,工具频繁调用,系统一直处于高活跃度状态。社区一直期待的是更强的持久化机制,让智能体可以优雅休眠、恢复上下文,而不是永远在线、永远烧API额度。
这里的机制问题在于状态保存。
智能体运行时包含上下文、工具缓存、子任务队列。如果引入sleep能力,需要设计状态序列化、恢复流程以及资源调度策略,这可不是加个开关那么简单。这句调侃等于公开承认:团队意识到这个需求,而且方向正在演进。
对技术人来说,这种坦诚反而增强信任感。与其藏着掖着,不如直接说“我们知道这事儿很重要,但还没做”。
从产品逻辑看,Sleep功能一旦落地,OpenClaw将进一步向长期自治智能体靠近。想象一下,你发一个任务,智能体处理两小时,期间自动休眠节省资源,等处理完了再通知你。这才是真正的agent workflow终局形态。否则一直在线,API账单分分钟爆炸——有用户实测,一个简单的监控任务,每5分钟跑一次,一个月烧掉128美元。这可不是开玩笑的。所以Sleep功能与其说是功能,不如说是刚需。
主要增强功能
1. 全面增强凭据/Secrets 支持
- 扩展 SecretRef 支持到用户供应凭据的完整路径(共 64 个目标),包括收集器、CLI 工具和运行时 UX。
- 使未解析引用能在活跃路径直接快速失败(有诊断提示),提高安全性和配置可靠性。
- 新增一流的 pdf 工具,支持本地 PDF 提取和分析功能。
- 提供 Anthropic 与 Google PDF 提供者支持,并包括非原生模型提取的降级方案与配置控制。
- 方便进行文档理解、摘要和智能操作。
- 引入统一的 sendPayload 跨频道支持,使 Discord、Slack、WhatsApp、Zalo 等多媒体发送逻辑一致,支持多媒体迭代和文本回退。
- 内置支持 MiniMax-M2.5-highspeed 模型,并兼容遗留的 MiniMax-M2.5-Lightning 配置,可更低成本接入高性能模型。
- 启用文件附件支持,可在子代理会话中内联附加文件。支持 Base64/UTF-8 编码、内容脱敏及生命周期清理。
- Telegram 默认开启流式预览(原先为关闭),支持私聊模式下通过 sendMessageDraft 实现“边思考边推送”预览。
- 还优化了群组语音消息的 @ 提及门控逻辑。
CLI 体验 & 配置工具
✔ 配置文件验证
- openclaw config validate 命令现在提供 JSON 验证输出,可在启动前检查潜在错误并给出详细路径提示。
- 记忆搜索与 Ollama 嵌入整合:增加 memorySearch 对 Ollama 的原生优先支持,并尊重 provider 配置优先级。
⚠ 重要变更(Breaking Changes)
这些变更可能影响升级体验,需要在部署前查阅对应文档:
- 默认安装现在启用了针对新本地安装的 tools.profile = messaging,减少不必要的系统工具加载。
- 默认启用 ACP Dispatch(高级消息路由),可按需通过配置关闭。
- 插件 SDK 删除旧的 api.registerHttpHandler() 方法,改用更明确的 registerPluginHttpRoute() 进行注册。
- Zalo 用户插件现在要求显式通过 CLI 登录后刷新会话。
修复与稳定性改进
本次版本包含大量 稳定性改进,如:
- 更稳健的 Telegram/Feishu/Slack 组消息处理。
- 针对系统网关、插件与 webhook 工作流的启动/错误修复。
- 更安全的默认 WS/HTTP 行为与严格头部检查。
总结:这是一次聚焦于 能力扩展(PDF、模型支持)、媒体与会话质量提升 和 开发者体验保障 的版本。虽然有一些默认行为变更,但在整体安全性与可扩展性上带来了明显增强。