工具与实战|2026年3月8日|12 分钟阅读

第 4 集:从 AI 到助手

完成安装和飞书接入之后,真正的变化才开始:让 OpenClaw 开始碰文件、执行脚本、查网页、操控浏览器,并在远程主机上持续在线。先学会这些动作,再谈人格和自动进化。

如果前三集已经解决了“能不能装上”“能不能聊起来”“能不能把它接进飞书”,这一集要解决的是另一个问题:

怎么让 OpenClaw 从一个会聊天的 AI,变成一个真的能帮你做事的助手。

很多人一到这一步,就急着写 SOUL.mdIDENTITY.md、人格设定和一堆长期规则。

这些东西当然重要。
但对新手来说,更先发生价值的,通常不是“它像谁”,而是“它能不能先替你做一件真正有用的事”。

所以这一篇不先讲复杂人格,也不先讲长期自动进化。
先讲 5 个最值得立刻学会的能力:

  1. 让它开始碰文件
  2. 让它开始执行脚本和命令
  3. 让它开始查网页,而不是只靠模型胡猜
  4. 让它开始操控一个专用浏览器
  5. 让它开始在远程主机上持续在线

先把这些动作跑通,OpenClaw 才会开始真正像“助手”。


先记住一个判断标准:什么时候 AI 才开始像助手

对新手来说,可以用一句话判断:

当它不仅能回你一句话,还能进入你的工作环境、使用工具、拿回结果,它才开始像助手。

OpenClaw 官方工具文档里,已经把这件事说得很明确了:

  • coding 工具档位默认会带上文件、运行时、会话、记忆和图片相关工具
  • OpenClaw 还有内建的 browsercronnodescanvas 等一等工具
  • web_searchweb_fetch 是网页工具,不等于浏览器自动化

翻译成大白话就是:

  • 它不只会说
  • 它还会动文件
  • 会跑命令
  • 会读网页
  • 会开浏览器
  • 会被放到另一台机器上持续在线

这就是第 4 集的主线。


第 1 步:先给它一个专用工作区,让它开始碰文件

第一件事,不是让它接管你的整台电脑。
第一件事,是给它一个你愿意让它练手的目录。

最简单的做法是自己先建一个文件夹:

mkdir -p ~/openclaw-lab
cd ~/openclaw-lab

然后把一小批你不怕折腾的文件放进去,比如:

  • 几个 Markdown 笔记
  • 一份 CSV 导出
  • 一组待整理截图
  • 一个测试用的小脚本

为什么要这样做?

因为 OpenClaw 的文件能力是真实的。
官方工具组里,group:fs 包括 readwriteeditapply_patch。这意味着它不是在“假装处理文件”,而是真的可以读写。

新手最适合先试的任务是这些:

把这个文件夹里的 Markdown 全部读一遍,帮我整理成一个摘要索引。
扫描这个目录,把文件名混乱的截图按日期重命名,但先只给我计划,不要真正改。
把这个 CSV 里的重复行找出来,并生成一份清洗建议。

第一轮不要让它碰:

  • 你的家目录
  • 公司的正式仓库
  • 带密码或密钥的目录
  • 你只有一份原件的重要资料

先让它在可回滚的小环境里开始“碰文件”,这是最稳的一步。


第 2 步:让它开始执行脚本,但先选可回滚任务

当它已经能读文件,下一步就是让它不只“看”,而是真的“做”。

OpenClaw 的 runtime 工具组包括:

  • exec
  • bash
  • process

这意味着它可以执行命令、启动进程、跑脚本。
但你第一次用,不要直接把它推到危险任务上。

先从这类任务开始:

在这个目录里运行测试,把失败点总结成中文,不要修改代码。
运行这个 Python 脚本,如果报错就把报错原因和修复建议列出来。
把 logs 目录里过去 24 小时的日志汇总成 10 条关键结论。
帮我把这个批处理脚本先 dry-run 一遍,确认它会改哪些文件。

这里有两个官方边界值得你知道:

第一,OpenClaw 有 sandbox 和 exec approvals 机制。
第二,即使有这些机制,你第一次也还是应该选“可回滚、可验证、低破坏性”的任务。

原因很简单:
安全功能是护栏,不是让你第一天就开车下悬崖的理由。

如果你要一个最稳的升级顺序,就是:

  1. 先让它读文件
  2. 再让它跑只读类命令
  3. 最后再让它真正改文件或执行副作用明显的脚本

第 3 步:把“会上网”和“会开浏览器”分开理解

这是很多新手最容易混淆的地方。

OpenClaw 里有两类完全不同的网络能力:

一类是网页工具

官方 Web Tools 文档写得很清楚:

  • web_search 用来搜索网页
  • web_fetch 用来抓取并提取网页正文
  • 对于需要登录、依赖 JavaScript 的网站,要改用 Browser 工具

这意味着日常资料查询,最好的顺序通常不是先开浏览器,而是先把网页工具配好。

如果你还没配过,最简单的做法是:

openclaw configure --section web

然后把搜索 API 配进去。
官方当前支持的搜索来源包括 Brave、Perplexity、Gemini with Google Search、Grok 和 Kimi。

有两个实用点值得记住:

  • web_fetch 不需要浏览器,也不执行 JavaScript
  • web_search 需要你先配置对应 provider 的 API Key

你可以马上试这些任务:

先用 web_search 查今天关于 OpenClaw 浏览器工具的最新官方文档,再用 web_fetch 读原文,最后给我一个中文摘要。
搜索三篇关于 Tailscale Serve 的官方文档,只保留和 OpenClaw 远程访问最相关的部分。

另一类是浏览器自动化

当网页工具不够时,再上浏览器。

适合直接上浏览器的情况是:

  • 页面内容必须执行 JavaScript 才能显示
  • 你需要登录网站
  • 你要点击、输入、截图、下载
  • 你要验证某个页面到底“长什么样”

这两件事分清楚,你就不会一遇到网页任务就本能地把浏览器拉起来。


第 4 步:需要网页操作时,再让它接管专用浏览器

OpenClaw 官方 Browser 文档当前给出的推荐思路很明确:

  • 它可以启动一个独立的 Chromium 系浏览器配置
  • 默认的 openclaw profile 是和你日常浏览器隔离的
  • 它可以开标签页、读页面、点击、输入、截图

对新手来说,最重要的不是参数,而是两个习惯。

习惯一:永远先用专用浏览器,不要先碰你的日常浏览器

先启动它:

openclaw browser start

然后打开一个页面:

openclaw browser open https://docs.openclaw.ai

你也可以直接在对话里让 OpenClaw 帮你做:

打开 OpenClaw 官方文档首页,帮我找到 Browser tool 页面,并截图给我看关键段落。

习惯二:遇到登录页,手动登录,不要把密码交给模型

官方 Browser Login 文档已经明确写了:

  • 推荐手动登录
  • 不要把凭证交给模型
  • 自动登录容易触发反机器人机制

所以正确做法是:

  1. 让 OpenClaw 打开登录页
  2. 你自己在专用浏览器里完成登录
  3. 登录完成后,再让它继续后续页面操作

第一次最适合尝试的浏览器任务是:

打开这个后台页面,帮我读出当前有哪些待处理项,但先不要点击任何发布按钮。
打开这个网页,截图首屏、提取主要 CTA,并告诉我页面结构。
进入这个文档站点,把安装相关页面依次打开并生成一份导航清单。

浏览器最适合做的是“看、点、读、截、填”。
不要第一天就让它直接做高风险发布操作。


第 5 步:让它从“本地会话”变成“持续在线的助手”

到这一步,你已经会用了:

  • 文件
  • 脚本
  • 网页
  • 浏览器

但它还像一个“只有你坐到电脑前才存在的助手”。

如果你想让它更像真的助手,下一步不是更换人格,而是把它放到一个更稳定的运行位置。

OpenClaw 官方 Remote Access 文档给出的核心建议很一致:

  • Gateway 默认绑在 loopback
  • 远程访问优先用 SSH tunnel 或 Tailscale
  • 想要 always-on,就把 Gateway 放到一台持续在线的主机上

最简单的远程方式是 SSH 隧道:

ssh -N -L 18789:127.0.0.1:18789 user@host

然后你在本地继续访问:

http://127.0.0.1:18789/

如果你更想走更顺手的长期方案,官方也支持 Tailscale Serve。

这一步的意义,不是“酷”。
而是:

  • 你的电脑休眠了,助手还活着
  • 你出门了,还能连回自己的 Gateway
  • 你的聊天渠道、会话和状态留在一台稳定主机上

还有一个很实用的延伸能力:

官方 Nodes 文档说明,macOS / iOS / Android / headless 设备都可以作为 node 挂到 Gateway 上。
这意味着“AI 在服务器上运行,但浏览器、相机、系统命令在另一台设备上执行”这件事,是被官方支持的。

先不用一口气全配上。
先知道:OpenClaw 不一定非得只活在你眼前这台电脑里。


现在最适合你立刻复制的 6 个任务

如果你今天就想把 OpenClaw 从 AI 用成助手,最适合复制的是这些:

读一遍 ~/openclaw-lab 里的所有 Markdown,给我一份目录索引和摘要。
运行这个项目的测试,把失败原因按“问题-原因-建议修复”的格式写出来。
先用 web_search 搜索 OpenClaw Browser 官方文档,再用 web_fetch 读正文,最后给我中文总结。
打开 docs.openclaw.ai,找到 Remote Access 页面,并把 SSH 隧道那一段截图给我。
把 logs 目录里过去 24 小时最重要的 10 条变化列出来,不要修改任何文件。
检查这个 CSV 和这个 Markdown 摘要是否一致,不一致的地方列一个对照表。

如果这 6 类任务你已经能顺畅跑通,OpenClaw 就已经不只是“聊天 AI”了。


这一集先不急着做的事

为了让主线更清楚,这一集故意不展开三个主题:

1. 不展开 Skills

因为一旦开始讲 Skills,话题就会从“用现成能力做事”切到“怎么给它继续长能力”。
这个更适合下一集。

2. 不展开长期记忆、Heartbeat 和 Cron

这些东西是“助手感”真正变强的关键。
但它们更适合放到第 6 集系统讲。

3. 不展开高级安全配置

不是因为它不重要,而是因为你已经有一篇单独的安全文章。
这一集只强调最基本的动作边界:专用目录、专用浏览器、专用主机、不要乱给权限。


总结

很多人把“从 AI 到助手”理解成先写人格、先写灵魂、先写一大堆长期规则。

不够准确。

对新手来说,真正让 OpenClaw 开始变成助手的,是这几个能力第一次跑通:

  • 它能帮你处理文件
  • 它能帮你执行脚本
  • 它能帮你查网页
  • 它能帮你操控浏览器
  • 它能被放到持续在线的环境里

先把这些动作学会,后面的 Skills、记忆、心跳、主动推送,才会真正有意义。

一句话总结这一集:

助手不是“更会聊天的 AI”,而是“开始进入你的环境并替你完成动作的 AI”。

下一集,就继续往前走:

给 OpenClaw 装上技能。

参考依据