AI端侧应用、氛围编程

Chrome 146推出WebMCP：浏览器直供智能体机器人访问！

如果浏览器不再仅仅为人类设计，而是也为智能体设计，这将彻底改变网络开发。

浏览器不再是人类的专属领地

你打开Chrome浏览器，以前只有你能看懂那些花花绿绿的按钮和表单，AI想帮你订个机票，得像个盲人摸象一样疯狂截屏、识别文字、猜测这个按钮是干嘛的。网站一改版，AI当场傻眼，找不到北。

现在Chrome 146扔下一颗深水炸弹，名字叫WebMCP。这玩意儿彻底改变了游戏规则，浏览器不再是专门给人类设计的了，AI代理也能成为网络世界的"一等公民"。

这相当于给AI装上了直达电梯，再也不用爬楼梯了。以前AI要"装得像个人"一样去看网页、找按钮、点链接，现在直接通过一个叫navigator.modelContext的API，绕过所有图形界面，跟网站内核直接对话。

打个比方，以前你想让AI帮你订机票，它得盯着屏幕截图，分析哪个是出发地输入框，哪个是日期选择器，点错了还得重来。现在有了WebMCP，AI直接给航空公司网站发命令："我要一张明天去北京的机票"，网站秒回结果，干净利落。

开发者Alex Volkov说得好："WebMCP就相当于UI里的API"。这句话点透了本质，AI和网页之间实现了从"视觉模拟"到"逻辑直连"的跃迁，传统的Web交互范式正在走向终结。

两种接入姿势任君选择

Chrome团队给开发者准备了两套灵活的API接入方式，就像给AI开了两条高速公路。

第一条是声明式API，适合标准操作，直接在HTML表单里定义就行。
第二条是命令式API，用JavaScript执行更复杂、更动态的互动。

这两种方式让开发者可以为AI提供一套直接的工具集，Agent跳过视觉识别，直接访问网站背后的结构化函数。

谷歌软件工程师Khushal Sagar在演讲中表示，WebMCP的目标是成为AI应用领域的USB-C接口。这个比喻很形象，就像USB-C统一了充电接口一样，WebMCP想统一AI跟网页打交道的方式。

更重要的是，这不仅是让智能体替代用户，而是建立一种全新的协作模式：用户、网页、智能体三者共享界面，共同协作。开发者在为人类设计UI的同时，为智能体提供结构化的API路径，两条腿走路。

省钱省到姥姥家

数据不会骗人。GitHub上的实测结果显示，用WebMCP工具对比传统的截图方式，简单任务（比如把计数器设为42）能省下89%的token消耗，成本降低83%。复杂任务（比如创建日历事件）也能省下77%的token，成本降低76%。

为啥这么省？因为截图太贵了。一张1512x982分辨率的截图要消耗约2000个token，而工具调用的JSON响应通常只用20到100个token。而且用工具调用不需要反复截图确认操作是否成功，响应直接告诉你成功了没。

以前AI像个近视眼，必须凑得很近才能看清屏幕，还得反复确认"我点对了没"。现在直接跟网站内核对话，效率提升不是一星半点。

Chrome内置AI全家桶来了

Chrome团队正在疯狂加码内置AI能力，给网页开发者提供全新的客户端AI任务解决方案。他们的目标是用浏览器管理的高效AI模型（比如Chrome里的Gemini Nano），通过高级API提供简单路径。

最新加入早期预览计划（EPP）的功能包括：

Prompt API现在支持多模态能力，可以处理视觉和音频信息，不只是文字。Gemini Nano能帮你描述图片内容或者做语音转录，本地就能跑，不用把数据发到云端。

Proofreader API专门用来校对文本，目前支持英语。写邮件、发评论之前让AI帮你检查一遍语法错误，避免尴尬。

还有Firebase团队的Firebase AI Logic，搞了个混合AI方案。AI任务可以在设备上高效运行，用内置AI API，也可以根据用户设备和浏览器的能力，自动切换到Google Cloud云端运行，灵活得很。

怎么加入这场狂欢

想尝鲜的话，Chrome 146早期预览版已经可以通过开启特定flag体验WebMCP。不过要加入早期预览计划（EPP）得填个调查问卷，而且必须提供邮箱地址，因为访问权限是人工审核发放的。

这个问卷不仅是申请入口，还能帮助Chrome团队了解开发者需求，决定产品方向。填了表就有机会提前体验这些实验性功能，走在别人前面。

目前这些API包括Prompt API、Proofreader API、Summarizer API、Translator API、Writer API、Rewriter API等等，都在逐步开放中。有些已经在Chrome 138稳定版可用，有些还在Origin Trial阶段，有些只对EPP成员开放。

设备要求方面，目前需要桌面电脑，至少4GB内存和22GB可用存储空间。移动端支持还在路上，等Gemini Nano推出更小的版本，手机和平板也能用上这些功能。

前端工程师要失业了吗

这个消息一出，前端圈子里炸锅了。有人说这是"前端最后防线告急"，有人担心以后不需要做漂亮的UI了，因为AI直接调API就行。

但冷静想想，WebMCP的设计哲学是"人在回路中"，人类界面依然是主要的交互方式，AI只是辅助。而且网站为了让人类用户满意，依然需要好看的界面和流畅的体验。WebMCP只是多开了一扇门，不是要把原来的门封死。

换个角度想，这给前端工程师打开了新世界的大门。以前你的技能树只能服务人类用户，现在你可以同时为AI代理设计接口，一个人干两份活，竞争力翻倍。

更重要的是，WebMCP让小型开发者也能搭上AI的快车。以前要让AI能操作你的网站，得单独开发一套后端API，成本高昂。现在直接在现有网页里注册几个工具函数就行，门槛大大降低。

范式改变

WebMCP的诞生释放了一个极其明确的信号：AI Agent与网页交互的底层逻辑正在迎来彻底重塑。这不仅仅是技术升级，而是整个互联网生态的范式转移。

当AI不再需要"装人"，当浏览器开始同时为人类和机器服务，网页开发的思维方式必须跟着变。以后设计网站，你得同时考虑"人类用户怎么看"和"AI代理怎么调"，就像现在既要考虑桌面端又要考虑移动端一样。

Google和微软都在推这个标准，说明行业巨头已经达成共识。未来可能每个主流浏览器都会支持WebMCP，就像现在每个浏览器都支持JavaScript一样。

意味着一代人上网的方式可能会彻底改变。现在的你们用鼠标点击、用手指滑动，未来的你们可能只需要跟AI说句话，它就能帮你搞定一切。而支撑这一切的，就是像WebMCP这样的底层技术。

浏览器不再是人类的专属领地，AI正式成为网络世界的合法居民。这场静悄悄的革命，正在Chrome 146的代码里悄然发生。

总结

Chrome 146推出WebMCP早期预览，AI代理可直接调用网站API无需模拟人类操作，token消耗降低89%，标志着浏览器从人类专属工具向人机共享平台转型。

Chrome 146推出WebMCP：浏览器直供智能体机器人访问！

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道