Unbrowse是OpenClaw的一个插件。OpenClaw是一个开源框架,专门打造真正能做事的AI代理。大多数AI代理只会聊天,OpenClaw的代理能行动。它们能发邮件、管日历、部署代码、监控聊天、发社交媒体、跑定时任务,全部自主完成。想象一下给AI模型装上双手,这就是OpenClaw。
Unbrowse让这些双手在网页上快100倍。
OpenClaw给你的代理提供工具:文件系统、命令行、浏览器控制、消息、调度、记忆。Unbrowse捕获任何网站的内部API,自动把它们变成新工具。你的代理对它访问过的每个网站都获得永久、快速的访问权限。第一次访问用浏览器,之后每次访问都是直接API调用。你的代理越工作越快,这简直就是AI界的复利效应。
你的AI代理还在用浏览器假装人类,这就是问题的根源
每次你的AI代理需要干点网页上的活儿,比如查个价格、下个单、填个表,它就老老实实启动Chrome浏览器,等着JavaScript把页面渲染出来,然后在DOM树里翻箱倒柜找元素,点按钮,再从屏幕上扒文字。这一套流程走下来,10到45秒就这么没了。成功率只有70%到85%,也就是说每做四件事就有一件会翻车。
更离谱的是,这玩意儿要吃掉500MB以上的内存,就为了跑一个无头浏览器。与此同时,你代理做的每一个动作,本质上都是一个API调用套了个按钮的皮。这就好比穿着宇航服去便利店买瓶水,仪式感拉满,效率归零。
100倍的差距到底在哪
举个例子,当你的代理去Polymarket查选举赔率的时候,浏览器自动化流程是这样的:启动Chrome花5秒,加载页面3秒,等JavaScript跑完2秒,找到那个元素1秒,读取文字再花1秒。加起来整整12秒。但就在那个页面加载的时候,网站自己调了个GET /api/markets/election,一个请求就把所有干净整齐的JSON数据返回了,只用了200毫秒。
你的代理花了12秒做了一件网站200毫秒就能搞定的事。这差距不是优化能解决的,这是物种级别的差距。放大到10个网页操作的工作流,浏览器自动化要磨蹭2分钟以上,直接调API只要2秒。这不是快一点慢一点的问题,这是一个让你觉得代理坏了和一个让你觉得代理开了挂的区别。
不只是读数据更快这么简单
这事儿远不止是获取数据的速度问题。网页上的每一个动作,本质上都是API调用。点"下单交易"按钮?那是POST请求。在LinkedIn上提交表单?POST。在Slack发消息?POST。订机票?还是POST。浏览器不过是API调用的图形界面,你的代理根本不需要这个界面。
浏览器自动化下单的流程是这样的:导航到市场页面5秒,找到输入框2秒,输入金额1秒,点击"下单"按钮1秒,等待确认3秒,总共12秒,失败率约20%。
而用Unbrowse呢?直接POST /api/trades,200毫秒,搞定。读取数据、提交表单、下单交易、发布内容、预订航班,全部以API速度完成,没有中间商赚差价。
Unbrowse的工作原理揭秘
Unbrowse不看网站展示什么,只看网站在后台做什么。
第一步是捕获:你浏览一次网站,Unbrowse通过Chrome DevTools协议拦截所有网络流量。每一个XHR请求、fetch调用、WebSocket连接、认证头、Cookie,全部被记录下来。
第二步是提取:捕获的流量被分析,识别出真正的API端点。认证方式自动检测,Bearer令牌、Cookie、API密钥统统逃不过它的眼睛。参数被推断出来,端点按资源聚类。
第三步是生成:输出一套完整的API技能包,包括带文档的端点、TypeScript客户端、认证配置。
你的代理现在可以直接调用这些API了。一次浏览,永久API访问,再也不需要浏览器。
数字不会撒谎
浏览器自动化和Unbrowse的对比如下:速度方面,前者10到45秒,后者200毫秒。可靠性方面,前者70%到85%,后者95%以上。
资源占用方面,前者需要无头Chrome吃掉500MB以上内存,后者只是普通的HTTP调用。
数据格式方面,前者是从DOM里 scraped 的文本,后者是干净的JSON。
操作方式方面,前者是点击、输入、等待、祈祷,后者是直接API调用。
这些数字摆在这里,选择困难症都能瞬间治愈。
技能会自我繁殖
每一个被Unbrowse捕获的API都会变成一个"技能",一个任何OpenClaw代理都能安装的可复用包。一个代理搞懂了Polymarket的API,现在所有代理都能以API速度在Polymarket交易,再也不用打开浏览器。
一个代理摸清了Airbnb的内部端点,现在所有代理都能在200毫秒内搜索房源。技能会复合增长,生态系统随着每个用户变得更聪明。
我们正在打造一个市场,让代理们分享和交易这些技能,使用x402微支付,让代理能自己给自己买能力。不需要人类批准,代理自己获取自己的工具。这听起来像科幻小说,但代码已经写好了。
更大的图景
目前代理访问网页的方式是残缺的:官方API很棒,但只有约1%的网站提供。MCP服务器也很棒,但每个都需要人工手动搭建。浏览器自动化到处都能用,但它慢、脆弱、昂贵。
99%的网页被锁在浏览器自动化后面,Unbrowse以API速度解锁它们。
每个网站本来就有内部API。React应用、单页应用、仪表盘,它们都从后端获取数据。浏览器只是渲染层。浏览器自动化本质上是在:启动浏览器,把JSON渲染成HTML,把HTML再 scrape 回数据,点击那些发送API请求的按钮,
而这些请求代理本来就能直接发。JSON变成HTML,HTML变成数据,数据再触发API调用。四步才能做完的事,其实一步就能搞定。
开源的力量
两个项目都是MIT许可证:
npm install -g openclaw
openclaw plugins install
OpenClaw和Unbrowse都在GitHub上敞开大门。每个网站本来就有API,你的代理只是不知道而已。现在,它知道了。
总之:
Unbrowse通过捕获网站内部API将浏览器自动化转换为直接API调用,速度提升100倍可靠性达95%以上,为OpenClaw AI代理提供永久快速网页访问能力。