浏览器自动化

YouClaw 的浏览器功能让 AI 助手能够在真实浏览器会话中工作。它可以打开页面、切换标签页、点击按钮、填写表单、抓取页面快照,并在后续对话中复用你已经保存的登录状态。

工作方式

浏览器能力围绕持久化的浏览器 Profile 构建:

  • 托管 Profile — 由 YouClaw 启动本地 Chrome 或 Chromium
  • Remote CDP Profile — 连接到一个已经开启 Chrome DevTools Protocol 的浏览器
  • 持久化会话 — Cookie、本地存储和其他浏览器状态保存在 Profile 目录中,后续任务可继续复用

典型使用流程

  1. 在设置中创建一个浏览器 Profile。
  2. 启动该 Profile,并手动登录需要访问的网站。
  3. 将这个 Profile 绑定到 Agent,或者在聊天中直接选择它。
  4. 之后让 YouClaw 在同一个浏览器会话里继续执行任务。

这使得浏览器自动化特别适合登录后的网站,例如后台系统、管理面板、卖家中心或企业内部工具。

YouClaw 目前能做什么

通过内置浏览器工具,YouClaw 目前可以:

  • 查看浏览器运行状态和当前标签页
  • 打开新标签页或跳转到指定 URL
  • 抓取当前页面的轻量文本快照
  • 对当前页面截图
  • 通过 CSS Selector 点击页面元素
  • 向输入框或文本域输入内容
  • 发送 Enter 等按键
  • 关闭当前标签页

如果任务需要更高级的浏览器操作,YouClaw 也可以回退到旧版 agent-browser 技能,例如显式等待、交互元素引用、selectcheck 操作、导出 PDF、视觉 diff,以及会话状态导入导出。

Agent 和聊天中的浏览器 Profile

浏览器 Profile 可以在两个层级使用:

  • Agent 默认 Profile — 这个 Agent 每次运行时都复用同一个浏览器会话
  • 聊天级选择 — 某个对话单独选择一个 Profile,或者切换为 No browser

这样你可以为工作账号、个人账号、测试环境或不同客户分别维护独立的浏览器状态。

手动登录与安全建议

手动登录是默认且推荐的方式。

  • 不要把密码、2FA 验证码、恢复码或会话密钥发给 AI 助手
  • 如果网站出现验证码、异地登录校验、设备验证或其他反自动化检查,应由你手动接管
  • 对于支付、购买、账户安全修改、发布内容、删除数据等高风险操作,建议由 YouClaw 先把页面准备好,再由你完成最后确认

什么时候适合开启浏览器模式

以下场景更适合使用浏览器模式:

  • 需要访问登录后页面
  • 希望在多个任务之间复用真实浏览器会话
  • 需要抓取当前页面截图或文本内容
  • 需要在固定网页界面中自动完成重复步骤

如果你只是想获取公开网页上的最新信息,网页搜索通常比浏览器自动化更合适。

隐私与数据存储

浏览器数据保存在你的本地设备上。

  • 托管 Profile 会把浏览器数据保存在本地 Profile 目录
  • 登录状态只会通过你选中的 Profile 被复用
  • 删除浏览器 Profile 时,也会一并删除该 Profile 保存的浏览器数据