Skip to content

# opensoul browser

管理 OpenSoul 的浏览器控制服务器并运行浏览器操作(标签页、快照、截图、导航、点击、输入)。

相关:

# 通用标志

  • --url <gatewayWsUrl>:Gateway 网关 WebSocket URL(默认从配置获取)。
  • --token <token>:Gateway 网关令牌(如果需要)。
  • --timeout <ms>:请求超时(毫秒)。
  • --browser-profile <name>:选择浏览器配置文件(默认从配置获取)。
  • --json:机器可读输出(在支持的地方)。

# 快速开始(本地)

bash
opensoul browser --browser-profile chrome tabs
opensoul browser --browser-profile opensoul start
opensoul browser --browser-profile opensoul open https://example.com
opensoul browser --browser-profile opensoul snapshot

# 配置文件

配置文件是命名的浏览器路由配置。实际上:

  • opensoul:启动/附加到专用的 OpenSoul 管理的 Chrome 实例(隔离的用户数据目录)。
  • chrome:通过 Chrome 扩展中继控制你现有的 Chrome 标签页。
bash
opensoul browser profiles
opensoul browser create-profile --name work --color "#FF5A36"
opensoul browser delete-profile --name work

使用特定配置文件:

bash
opensoul browser --browser-profile work tabs

# 标签页

bash
opensoul browser tabs
opensoul browser open https://docs.opensoul.ai
opensoul browser focus <targetId>
opensoul browser close <targetId>

# 快照 / 截图 / 操作

快照:

bash
opensoul browser snapshot

截图:

bash
opensoul browser screenshot

导航/点击/输入(基于 ref 的 UI 自动化):

bash
opensoul browser navigate https://example.com
opensoul browser click <ref>
opensoul browser type <ref> "hello"

# Chrome 扩展中继(通过工具栏按钮附加)

此模式让智能体控制你手动附加的现有 Chrome 标签页(不会自动附加)。

将未打包的扩展安装到稳定路径:

bash
opensoul browser extension install
opensoul browser extension path

然后 Chrome → chrome://extensions → 启用"开发者模式" → "加载已解压的扩展程序" → 选择打印的文件夹。

完整指南:Chrome 扩展

# 远程浏览器控制(node host 代理)

如果 Gateway 网关与浏览器运行在不同的机器上,在有 Chrome/Brave/Edge/Chromium 的机器上运行 node host。Gateway 网关会将浏览器操作代理到该节点(无需单独的浏览器控制服务器)。

使用 gateway.nodes.browser.mode 控制自动路由,使用 gateway.nodes.browser.node 在连接多个节点时固定特定节点。

安全 + 远程设置:浏览器工具远程访问Tailscale安全

Released under the MIT License.