评分 7 · 来源:Hacker News · 发布于 2026-03-11
评分依据:Fork Chromium 将浏览器导航改为确定性操作,在 Mind2Web 基准上达 90.5%,比 Playwright MCP token 用量减半、速度翻倍
核心创新
ABP 的关键洞察:Web 浏览是连续异步的,但 Agent 思考是离散步进的。它将浏览器导航重新格式化为 Agent 熟悉的离散多模态格式。
工作方式
与传统浏览器自动化的区别:
- 一个请求 = 一个完成的步骤:稳定状态 + 截图 + 事件日志
- 无 WebSocket,无 CDP 会话管理,只需 HTTP
- ~100ms 每步开销(含截图),瓶颈在 LLM 不在浏览器
- 每步之间冻结页面,Agent 永远不会与浏览器竞争
性能表现
与 Playwright MCP 对比:
- Token 用量减半
- 自动化速度翻倍
- 工具调用次数减半
- Online Mind2Web 基准:90.53%(使用 Claude Opus 4.6)
快速上手
# 添加为 Claude Code 的 MCP 服务器
claude mcp add browser -- npx -y agent-browser-protocol --mcp
# 验证服务
curl -s http://localhost:8222/api/v1/tabs
然后直接问 Claude:“在 DoorDash 上找 Mission St 415 号附近的宫保鸡丁。“
意义
ABP 代表了浏览器自动化的一个新范式:不是在标准浏览器上增加一层控制层,而是从根本上为 Agent 场景重新设计浏览器。确定性操作(注入真实输入事件 → 等待稳定 → 截图 → 暂停 JS)消除了传统方案中状态同步这个最大痛点。