Chrome插件:浏览器MCP智能遥控器


MCP 是用来管理你的浏览器的工具。这个浏览器MCP其实就是一个"遥控器服务器",能让VS Code、Claude这些程序像用遥控器一样操作你的浏览器。

它能干嘛呢:

  • 自动上网和填表格
  • 从网页里整理出规整的数据
  • 用AI智能做网站测试
  • 让智能助手帮你操作浏览器

什么是 MCP?
模型上下文协议 (MCP)允许 AI 应用程序与其他应用程序和服务进行交互。

通过浏览器 MCP,您可以使用 MCP 自动化您的浏览器,以便 AI 应用程序可以浏览网页、填写表格等。

入门
要使用浏览器 MCP,请按照以下步骤操作:

  1. 设置 MCP 服务器
  2. 设置扩展
  3. 开始自动化

网友
1、需要安装 Node.js 才能运行 MCP 服务器:https://docs.browsermcp.io/setup-server#node-js

2、这不本来就应该是个正常网站该有的样子吗?我们之前把所有精力都花在搞那些花里胡哨的页面(但电脑根本看不懂),现在又要在上面加个‘说话就能操作’的功能。那干嘛不干脆点,直接让用户用说话的方式控制网站呢?

3、好处是:通过使用真实的浏览器指纹来避免机器人检测和 CAPTCHA。
对此怀疑:几周前我用过一个类似的系统(我自己写的),让人工智能使用我的登录会话控制我的浏览器,我开始在浏览器中的人类会话期间收到验证码,最终我被一些网站屏蔽了。现在我已经停止以这种方式使用浏览器会话,屏蔽最终消失了,但请注意,这样做你会失去对网站的访问权限,这不是灵丹妙药。

4、我去购物网站的时候,就想跟我的浏览器说:‘喂,帮我把这页所有的餐具柜都看一遍,只挑高度超过155厘米、但不到100厘米的,最好是用深色木头做的,而且还得能放下31.43厘米高的黑胶唱片的那种!’
现在有浏览器能这么聪明吗?毕竟能自动从网页里找这些具体信息的话,那可太方便了!

5、有了"浏览器遥控器"(就是那个MCP),现在真的可以做到啦!比如你可以让ChatGPT/DeepSeek对你的浏览器说:

  1. "打开谷歌地图"
  2. "给我截个图看看"
  3. "点一下那个地方"
然后你就看到浏览器自己在哪个好像被无形之手操作一样。

6、做得好,刚刚在 Claude Desktop 上测试了一下,它运行顺畅,比 playwright 好用得多。这是正确的方向。

7、每次搞报销这种手工活都让我头大。这活儿实在太烦人了(而且对我们工作流程没啥帮助,真的不咋地)。每个月都要:登进服务商的网站,找到账单下载下来,新建个文档填信息,下载好,再写邮件把文件都传上去。有时候还得检查附件对不对,但想看又得重新下载,邮件里还不能直接看。
其实这些早就能自动搞定了(好用的记账软件至少能省一半功夫),不过我觉得AI工具还能帮我们干掉更多麻烦的固定操作。这点特别重要,因为这类工作流程基本都是一成不变的。

8、 MCP 是新的 RPA(机器人流程自动化)吗?就像通用的 Yahoo 管道一样?

9、为什么要使用它而不是 Puppeteer 或 Playwright 扩展?

10、Puppeteer MCP服务器不太好用,因为它要靠CSS选择器来操作网页元素。问题是它只会写CSS选择器,不会自己看网页然后生成能用的选择器。
Playwright MCP服务器就厉害多了!现在的浏览器MCP基本上就是在Playwright MCP服务器基础上改的,可以直接用你正在用的真浏览器,不用每次都开个新浏览器。这样就能继续用你原来的Chrome设置,不用重复登录所有网站,也不会像用Playwright开新浏览器那样老是被当成机器人。
我还打算加些其他实用功能(比如现在浏览器MCP已经能抓取控制台日志,对自动调试特别有用),这些功能可能会和Playwright MCP服务器不太一样。

11、为什么你选择使用这个插件扩展程序,而不是让用户在打开远程调试的情况下运行 Chrome?
使用真实的浏览器指纹避免机器人检测和验证码。

12、我为什么需要编辑器(Cusror)?非程序员如何使用它?
如果您不是编码员,请将其与 Claude Desktop 一起使用。

13、让它编写 unit/e2e 回归测试吗?
浏览器 mcp 生成的 aria 快照足以使用其基于角色的定位器为 playwright 编写测试,但我可能会以他们正在考虑的相同方式添加 get_page_html 工具:https://github.com/microsoft/playwright-mcp/issues/103

14、我不喜欢 LLM 的地方在于,人们总是一遍又一遍地重复做无用功。例如,我们现在已经能够使用 GPT 控制浏览器大约 2 年了: