尹家韬

如果前三集已经解决了“能不能装上”“能不能聊起来”“能不能把它接进飞书”，这一集要解决的是另一个问题：

怎么让 OpenClaw 从一个会聊天的 AI，变成一个真的能帮你做事的助手。

很多人一到这一步，就急着写 SOUL.md、IDENTITY.md、人格设定和一堆长期规则。

这些东西当然重要。
但对新手来说，更先发生价值的，通常不是“它像谁”，而是“它能不能先替你做一件真正有用的事”。

所以这一篇不先讲复杂人格，也不先讲长期自动进化。
先讲 5 个最值得立刻学会的能力：

让它开始碰文件
让它开始执行脚本和命令
让它开始查网页，而不是只靠模型胡猜
让它开始操控一个专用浏览器
让它开始在远程主机上持续在线

先把这些动作跑通，OpenClaw 才会开始真正像“助手”。

先记住一个判断标准：什么时候 AI 才开始像助手

对新手来说，可以用一句话判断：

当它不仅能回你一句话，还能进入你的工作环境、使用工具、拿回结果，它才开始像助手。

OpenClaw 官方工具文档里，已经把这件事说得很明确了：

coding 工具档位默认会带上文件、运行时、会话、记忆和图片相关工具
OpenClaw 还有内建的 browser、cron、nodes、canvas 等一等工具
web_search 和 web_fetch 是网页工具，不等于浏览器自动化

翻译成大白话就是：

它不只会说
它还会动文件
会跑命令
会读网页
会开浏览器
会被放到另一台机器上持续在线

这就是第 4 集的主线。

第 1 步：先给它一个专用工作区，让它开始碰文件

第一件事，不是让它接管你的整台电脑。
第一件事，是给它一个你愿意让它练手的目录。

最简单的做法是自己先建一个文件夹：

mkdir -p ~/openclaw-lab
cd ~/openclaw-lab

然后把一小批你不怕折腾的文件放进去，比如：

几个 Markdown 笔记
一份 CSV 导出
一组待整理截图
一个测试用的小脚本

为什么要这样做？

因为 OpenClaw 的文件能力是真实的。
官方工具组里，group:fs 包括 read、write、edit、apply_patch。这意味着它不是在“假装处理文件”，而是真的可以读写。

新手最适合先试的任务是这些：

把这个文件夹里的 Markdown 全部读一遍，帮我整理成一个摘要索引。

扫描这个目录，把文件名混乱的截图按日期重命名，但先只给我计划，不要真正改。

把这个 CSV 里的重复行找出来，并生成一份清洗建议。

第一轮不要让它碰：

你的家目录
公司的正式仓库
带密码或密钥的目录
你只有一份原件的重要资料

先让它在可回滚的小环境里开始“碰文件”，这是最稳的一步。

第 2 步：让它开始执行脚本，但先选可回滚任务

当它已经能读文件，下一步就是让它不只“看”，而是真的“做”。

OpenClaw 的 runtime 工具组包括：

exec
bash
process

这意味着它可以执行命令、启动进程、跑脚本。
但你第一次用，不要直接把它推到危险任务上。

先从这类任务开始：

在这个目录里运行测试，把失败点总结成中文，不要修改代码。

运行这个 Python 脚本，如果报错就把报错原因和修复建议列出来。

把 logs 目录里过去 24 小时的日志汇总成 10 条关键结论。

帮我把这个批处理脚本先 dry-run 一遍，确认它会改哪些文件。

这里有两个官方边界值得你知道：

第一，OpenClaw 有 sandbox 和 exec approvals 机制。
第二，即使有这些机制，你第一次也还是应该选“可回滚、可验证、低破坏性”的任务。

原因很简单：
安全功能是护栏，不是让你第一天就开车下悬崖的理由。

如果你要一个最稳的升级顺序，就是：

先让它读文件
再让它跑只读类命令
最后再让它真正改文件或执行副作用明显的脚本

第 3 步：把“会上网”和“会开浏览器”分开理解

这是很多新手最容易混淆的地方。

OpenClaw 里有两类完全不同的网络能力：

一类是网页工具

官方 Web Tools 文档写得很清楚：

web_search 用来搜索网页
web_fetch 用来抓取并提取网页正文
对于需要登录、依赖 JavaScript 的网站，要改用 Browser 工具

这意味着日常资料查询，最好的顺序通常不是先开浏览器，而是先把网页工具配好。

如果你还没配过，最简单的做法是：

openclaw configure --section web

然后把搜索 API 配进去。
官方当前支持的搜索来源包括 Brave、Perplexity、Gemini with Google Search、Grok 和 Kimi。

有两个实用点值得记住：

web_fetch 不需要浏览器，也不执行 JavaScript
web_search 需要你先配置对应 provider 的 API Key

你可以马上试这些任务：

先用 web_search 查今天关于 OpenClaw 浏览器工具的最新官方文档，再用 web_fetch 读原文，最后给我一个中文摘要。

搜索三篇关于 Tailscale Serve 的官方文档，只保留和 OpenClaw 远程访问最相关的部分。

另一类是浏览器自动化

当网页工具不够时，再上浏览器。

适合直接上浏览器的情况是：

页面内容必须执行 JavaScript 才能显示
你需要登录网站
你要点击、输入、截图、下载
你要验证某个页面到底“长什么样”

这两件事分清楚，你就不会一遇到网页任务就本能地把浏览器拉起来。

第 4 步：需要网页操作时，再让它接管专用浏览器

OpenClaw 官方 Browser 文档当前给出的推荐思路很明确：

它可以启动一个独立的 Chromium 系浏览器配置
默认的 openclaw profile 是和你日常浏览器隔离的
它可以开标签页、读页面、点击、输入、截图

对新手来说，最重要的不是参数，而是两个习惯。

习惯一：永远先用专用浏览器，不要先碰你的日常浏览器

先启动它：

openclaw browser start

然后打开一个页面：

openclaw browser open https://docs.openclaw.ai

你也可以直接在对话里让 OpenClaw 帮你做：

打开 OpenClaw 官方文档首页，帮我找到 Browser tool 页面，并截图给我看关键段落。

习惯二：遇到登录页，手动登录，不要把密码交给模型

官方 Browser Login 文档已经明确写了：

推荐手动登录
不要把凭证交给模型
自动登录容易触发反机器人机制

所以正确做法是：

让 OpenClaw 打开登录页
你自己在专用浏览器里完成登录
登录完成后，再让它继续后续页面操作

第一次最适合尝试的浏览器任务是：

打开这个后台页面，帮我读出当前有哪些待处理项，但先不要点击任何发布按钮。

打开这个网页，截图首屏、提取主要 CTA，并告诉我页面结构。

进入这个文档站点，把安装相关页面依次打开并生成一份导航清单。

浏览器最适合做的是“看、点、读、截、填”。
不要第一天就让它直接做高风险发布操作。

第 5 步：让它从“本地会话”变成“持续在线的助手”

到这一步，你已经会用了：

文件
脚本
网页
浏览器

但它还像一个“只有你坐到电脑前才存在的助手”。

如果你想让它更像真的助手，下一步不是更换人格，而是把它放到一个更稳定的运行位置。

OpenClaw 官方 Remote Access 文档给出的核心建议很一致：

Gateway 默认绑在 loopback
远程访问优先用 SSH tunnel 或 Tailscale
想要 always-on，就把 Gateway 放到一台持续在线的主机上

最简单的远程方式是 SSH 隧道：

ssh -N -L 18789:127.0.0.1:18789 user@host

然后你在本地继续访问：

http://127.0.0.1:18789/

如果你更想走更顺手的长期方案，官方也支持 Tailscale Serve。

这一步的意义，不是“酷”。
而是：

你的电脑休眠了，助手还活着
你出门了，还能连回自己的 Gateway
你的聊天渠道、会话和状态留在一台稳定主机上

还有一个很实用的延伸能力：

官方 Nodes 文档说明，macOS / iOS / Android / headless 设备都可以作为 node 挂到 Gateway 上。
这意味着“AI 在服务器上运行，但浏览器、相机、系统命令在另一台设备上执行”这件事，是被官方支持的。

先不用一口气全配上。
先知道：OpenClaw 不一定非得只活在你眼前这台电脑里。

现在最适合你立刻复制的 6 个任务

如果你今天就想把 OpenClaw 从 AI 用成助手，最适合复制的是这些：

读一遍 ~/openclaw-lab 里的所有 Markdown，给我一份目录索引和摘要。

运行这个项目的测试，把失败原因按“问题-原因-建议修复”的格式写出来。

先用 web_search 搜索 OpenClaw Browser 官方文档，再用 web_fetch 读正文，最后给我中文总结。

打开 docs.openclaw.ai，找到 Remote Access 页面，并把 SSH 隧道那一段截图给我。

把 logs 目录里过去 24 小时最重要的 10 条变化列出来，不要修改任何文件。

检查这个 CSV 和这个 Markdown 摘要是否一致，不一致的地方列一个对照表。

如果这 6 类任务你已经能顺畅跑通，OpenClaw 就已经不只是“聊天 AI”了。

这一集先不急着做的事

为了让主线更清楚，这一集故意不展开三个主题：

1. 不展开 Skills

因为一旦开始讲 Skills，话题就会从“用现成能力做事”切到“怎么给它继续长能力”。
这个更适合下一集。

2. 不展开长期记忆、Heartbeat 和 Cron

这些东西是“助手感”真正变强的关键。
但它们更适合放到第 6 集系统讲。

3. 不展开高级安全配置

不是因为它不重要，而是因为你已经有一篇单独的安全文章。
这一集只强调最基本的动作边界：专用目录、专用浏览器、专用主机、不要乱给权限。

总结

很多人把“从 AI 到助手”理解成先写人格、先写灵魂、先写一大堆长期规则。

不够准确。

对新手来说，真正让 OpenClaw 开始变成助手的，是这几个能力第一次跑通：

它能帮你处理文件
它能帮你执行脚本
它能帮你查网页
它能帮你操控浏览器
它能被放到持续在线的环境里

先把这些动作学会，后面的 Skills、记忆、心跳、主动推送，才会真正有意义。

一句话总结这一集：

助手不是“更会聊天的 AI”，而是“开始进入你的环境并替你完成动作的 AI”。

下一集，就继续往前走：

给 OpenClaw 装上技能。

第 4 集：从 AI 到助手