🌐 Agent Browser
核心基建 · 自动化 · Web 代理
基于 Rust 的高速无头浏览器自动化 CLI,支持 Node.js 回退,让您的 OpenClaw 智能体能够通过结构化命令极速导航、点击、输入并截取页面快照。
OpenClaw Team
🚀 快速安装
在您的终端中执行以下命令即可完成安装:
npx clawhub install agent-browser
📊 数据总览
| ⭐ 收藏点赞 | ☁️ 总计下载 | 👥 当前活跃 | 🎯 稳定版本 |
|---|---|---|---|
| 892 | 128k | 3,450 | v2.4.1 |
🎛️ 核心工作流
本拓展技能彻底打破了 AI 与终端之间的黑盒,赋予其直接与现代动态网络环境(DOM/Canvas)进行视觉与结构化交互的能力:
- 🌐 极速网页导航:接收 URL 指令,通过内置 Rust 引擎或 Node 层级秒级加载完整渲染后的页面(
navigate <url>)。 - 📸 视觉快照捕获:自动对目标节点或全屏进行高分辨率截图(
snapshot),无缝衔接至多模态大模型的视觉理解分析。 - 🖱️ 深度 DOM 交互:将自然语言意图转换为精确的结构化点击与表单输入指令,无需开发者手动编写复杂的 CSS 选择器。
- ⚡ 动态脚本注入:安全沙盒隔离设计,支持 AI 直接在当前生命周期的页面上下文中执行自定义 JavaScript(
evaluate)提取深层数据。
🧭 典型业务场景剖析
🤖 场景一:沉浸式演练与测试
让 AI 作为 QA 角色扮演最终用户,自动寻找输入框、走通极其复杂的 OAuth 登录链路,并进行页面的 DOM 断言检查。
🔍 场景二:突破屏障的全网知识检索
彻底不再受限于死板拘泥的纯文本 API 接口。当 AI 在编码时遇到最新框架的知识盲区,可直接驱动浏览器前往官方文档或 StackOverflow 阅读最新的代码片段。
🕸️ 场景三:动态数据自动化爬取
对于反爬校验严格或是强烈依赖 React/Vue 客户端水合渲染的单页复杂应用(SPA),实现"所见即所得"的降维强力抓取。
👁️ 场景四:多模态视觉 UI 审查
借由页面快照捕捉能力,直接由视觉模型核对上线前后的 UI 组件级细微差异,替代枯燥的人工跑查流程。
🛡️ 前置运行环境
- 📦 全局底层依赖环境:使用此技能必须确保底层的宿主机环境中已经全局安装了该驱动载体,请预先执行:
npm install -g agent-browser。 - ⚙️ 原生内核及回退机制:强烈建议当前操作系统环境内包含原生的 Chromium 或等效 WebKit 依赖集库。如缺失,CLI 将默认尝试拉起轻量级的 Node.js 兼容模拟回退机制。
© 2026 OpenClaw. All rights reserved.
