说说#软件#Open Claw

OpenClaw 系统级 AI 智能体：架构、演进、安全与商业竞品全景深度解析

2026-03-08|yancey|23 分钟阅读

☕ 这篇文章想用“个人博客”的方式，把最近很火的 系统级 AI 智能体（以 OpenClaw / lobsterai 为代表）讲清楚。
你不用懂架构，也不用会部署。只要你对 AI 好奇，或者心里也有这个更常见的问题：“AI 智能体到底是啥？我现在用它值得吗？” 读完都能带走一套更稳的判断框架。

适合：对 AI 助手好奇的普通用户、准备折腾本地部署的爱好者、以及想先搞清楚风险边界的人。

0. 先给结论（30 秒读完版）

系统级智能体的本质：不是“更聪明的聊天机器人”，而是把 AI 接到工具和系统上，让它能“动手做事”。
它为什么会爆火：入口在变（AI 住进更多软件和系统里），权限也在变（AI 从“会说”走向“会做”）。这两件事叠加，很容易形成全民热度。
它为什么看起来像淘金热：叙事和预期先跑，产品体验还在打磨。与此同时，成本与安全这些“现实问题”也被一起放大（所以后面要聊成本和安全）。
它为什么又容易翻车：权限一旦变高，错误就不再是“答错一句话”，而可能变成“删错文件、发错消息”。

1. 什么叫“系统级智能体”？用一句人话解释

如果把传统 LLM 想成“会聊天的百科全书”，那系统级智能体更像：

一个住在你电脑/服务器里的“数字外包”，它不仅能回答，还能调用工具去执行。

它通常长这样：

你在钉钉/飞书/Telegram/Discord 发一句话。
后台有个网关进程把消息变成“上下文”。
模型做计划，然后去跑脚本、读文件、开浏览器、发邮件。

这就是为什么它看起来像“未来的操作系统”。

2. 为什么最近像一场“淘金热”？原因确实没这么简单

这波浪潮很像淘金热：产品体验还在打磨，叙事和预期先冲了出去。

更关键的是，它把后面几节里提到的“成本、安全、治理”这些问题，提前一起点燃了。

可以把爆火原因拆成一条更完整的链路：

入口（分发）在变：AI 不再只住在一个对话框里，而是往聊天软件、手机系统、浏览器、企业协作工具里渗透。入口越多，越容易形成“全民可见”的热度。
权限（执行权）在变：AI 从“会说”走向“会做”（任务闭环）。一旦能动文件、能开浏览器、能发消息，就会让人产生一种强烈的预期：它可能直接改变工作方式。
情绪（焦虑）在变：当入口和执行权一起变强，很多人的第一反应不是兴奋，而是焦虑。焦虑大致会表现成三类：
- 效率焦虑：担心别人在用 AI 提速，自己还在原地踏步。
- 岗位焦虑：担心部分工作被压缩，人的位置从“执行者”变成“监督者”。
- 转型焦虑：各行业都在喊“AI+”，担心错过窗口期。
成本与风险被一起放大：这也是为什么后面会单独写“成本”和“安全”。
- 只要 AI 开始“动手”，就会出现 Token 乘数效应，成本从一次对话变成几十次小回合（第 3、5 节）。
- 权限越高，失败就越可能从“答错一句话”变成“真实事故”，所以安全与治理会变成主线（第 6、7 节）。

所以爆火并不是单点原因，而是“入口 + 权限 + 情绪 + 成本/安全”一起共振的结果。

参考阅读：罗兰贝格《2025 中国生成式 AI 市场的五大趋势分享》

https://www.rolandberger.com/zh/Insights/Publications/2025%E4%B8%AD%E5%9B%BD%E7%94%9F%E6%88%90%E5%BC%8FAI%E5%B8%82%E5%9C%BA%E7%9A%84%E4%BA%94%E5%A4%A7%E8%B6%8B%E5%8A%BF%E5%88%86%E4%BA%AB.html

2.1 入口（分发）：AI 住在哪里

一句话举例：以前你要“打开一个 AI App 才能问”，现在很多时候是在你每天用的聊天软件/手机系统里，顺手一句话就能触发。

住在聊天软件里（IM）。
住在手机系统里（OS）。
住在浏览器里。
住在企业协作套件里。

入口越自然，用户越愿意用。

2.2 执行面（环境）：AI 能动哪些东西

一句话举例：不再只是“帮你写一段话”，而是能把“把这份表格整理一下、把邮件发出去、把网页信息抓下来”这种事真的做完。

文件系统
Shell 命令
浏览器自动化
邮件、日历、网盘
业务 API

2.3 默认规则（权限与审计）：谁来背锅

一句话举例：如果 AI 能“自动发消息/自动改文件”，那一旦出错，就必须回答清楚：谁点的同意、做过什么、怎么撤回、由谁负责。

只要涉及“自动执行”，就绕不开：

谁授权
发生事故怎么回滚
日志怎么留
责任怎么划

3. 为什么当下经常“名誉大于实力”？三条硬约束

我自己更倾向于把它看成“很强的工程方向”，但今天的产品还没配得上今天的热度。

3.1 可靠性：越长的链路越容易断

系统级智能体往往是多步任务。

多一步就多一个失败点。

3.2 成本：你以为在用 AI，其实在烧 Token

上下文越来越长。
心跳越跑越勤。
失败重试一次比一次贵。

很多时候，“脚本 + 少量模型调用”就够了。

3.3 权限：一旦能动系统，就不再是“玩具问题”

聊天机器人答错，最多尴尬。

系统级智能体做错，可能就是事故。

所以接下来会分别看三件事：它的典型结构长什么样（第 4 节），最容易翻车的两块现实问题是什么（成本与安全，第 5/6 节），以及在手机端与国内环境下为什么会更“克制”（第 7 节）。

4. OpenClaw（lobsterai）这类系统通常由哪些模块组成？

不想看细节也没关系，你只要记住：它不是一个模型，而是一套“运行系统”。

快速阅读建议：

如果你是小白，看 4.1（网关） 和 4.4（调度） 就够了。
如果你准备自己部署，再看 4.3（工作区文件）。

4.1 网关（Gateway）：把多渠道输入统一起来

它负责把各种渠道的消息接进来，再把任务输出发回去。

4.2 记忆（Memory）：别把它想成玄学

更实用的做法是：

记忆落在本地文件（比如 Markdown）。
可读、可删、可版本控制。

4.3 工作区文件：用“配置即文本”约束它

常见会拆成几份文件（举例）：

SOUL.md：原则、边界、审批门槛。
USER.md：偏好与目标（不放敏感信息）。
AGENTS.md：SOP。
TOOLS.md：工具说明。
HEARTBEAT.md：巡检清单（越短越好）。

4.4 调度：Heartbeat + Cron 是一对经典组合

Heartbeat：周期巡检，没事别打扰。
Cron：定点执行，适合重任务与隔离。

4.5 工作流引擎（Lobster 思路）：把“不确定”变成“可控”

你可以把它理解为：

把 AI 的自由发挥，关进“可审计、可回滚”的流程轨道里。

5. 成本怎么控？只记住这 4 个关键词

缓存：静态提示词别重复算。
降级：简单活用便宜模型。
节流：心跳别乱跑。
Diff：只输出改动，不输出全文。

如果你做的是“联网查资料 / 网络资源分析”这类任务，再补一条更直白的经验：真正贵的往往不是流量，而是“联网后产生的反复思考与反复尝试”。

简单理解两笔账：

网络账：抓几个网页、拉一次 API，流量通常不大。
推理账（Token）：可以把它理解成 AI 的“话费/流量单位”。每一次“看网页 → 归纳 → 决定下一步 → 再看网页”都会把 Token 乘起来，尤其是浏览器自动化、反复重试时最烧。

怎么控？还是回到这 4 个关键词（套到网络任务上）：

缓存：同一个 URL、同一个查询结果，设一个 TTL（比如 10~60 分钟）复用，别反复抓。
降级：用便宜模型做“抓取/抽取/去重/结构化”，用贵模型做最后的总结和判断。
节流：给任务硬上限，比如“最多看 5 个网页、最多重试 2 次”，超过就停下来输出当前证据。
Diff：输出只给结论 + 关键证据点，不要把全文和过程日志都吐出来。

6. 安全：为什么系统级智能体更像 APT，而不是聊天机器人

系统级智能体最危险的点不是“它会不会胡说”。

而是：它会不会在你不注意时动你的真实系统。

6.1 常见风险（直白版）

装了来路不明的技能，像装了来路不明的软件。
看了一段网页摘要，结果被“隐形指令”带偏（提示词注入）。
自动化做错一步，影响扩散到更多系统。

6.2 防御建议（能做就做）

重要工具放进沙盒（容器）。
权限默认拒绝。
高风险动作必须人工确认。
留日志，能追溯，能回滚。

7. 豆包手机 vs 系统级智能体：为什么一个更容易普及？

我很喜欢用这个对比来理解“热度”和“落地”的差别。

7.1 入口：系统预装天然强

手机端 AI 更像“系统功能”，你不需要学习成本。

7.2 风险：手机端多是软失败

总结漏了。
理解错了。

通常可逆。

系统级智能体更容易硬失败：

删错文件。
发错消息。
执行错命令。

7.3 现实约束：很多深度操作在国内环境里“不被允许”

即便手机端入口更强，它在很多常用软件里的深度操作会被卡住：

权限与沙盒
企业内控与审计
个人信息与责任边界

所以手机端产品会更克制，更偏“生成、总结、检索”。

8. Claw/Paw 生态谱系（个人观察版）

一句话：这套“Claw/Paw”更像是按部署形态分阵营。

创世鼻祖：lobsterai（OpenClaw / 龙虾）——大而全，生态大，争议也多。
大厂/托管派（开箱即用）：CoPaw、Kimiclaw、Maxclaw、Molili——上手快，入口多。
极客开源派（本地轻量）：Nanobot、NanoClaw、Zeroclaw、Picoclaw——更轻、更可控，但更需要折腾。
系统硬件派：Xiaomi Miclaw——软硬件联动强，但生态绑定。
框架/能力派：Agent-S、EvoAgentX、OWL、AgentScope/AutoGen/CrewAI——更像工具箱与底座。

9. 快速选型（看 3 个问题就够了）

你是想 开箱即用，还是愿意 自己折腾？
你能接受 云端托管，还是更在意 本地可控？
你的任务是 写/读/总结，还是要 真的动手操作系统？

按这 3 个问题，基本就能落到下面 5 类：

大厂云端派（CoPaw / kimiclaw）：上手快，但自主性更弱。
轻量本地派（nanobot / zeroclaw）：省资源、可控，但需要命令行与维护。
视觉操作派（Agent-S）：能“点点点”传统软件，但误操作风险更高。
工作流协作派（EvoAgentX / OWL）：擅长复杂任务拆解，但环境要求更苛刻。
系统硬件派（Xiaomi Miclaw）：联动顺滑，但强绑定生态。

10. YouTube 教程（Windows / macOS）

下面把视频按“你想先跑起来体验”还是“要 24/7 常驻运行”分得更细，并给你一眼能选的说明。

A. 只想先跑起来体验（推荐优先看）

这类教程通常目标是：15~60 分钟内跑通一次。适合新手，失败成本低。

A1. Windows 11 + 本地模型（Ollama / 本地推理）

特点：不需要把数据交给云端，适合先熟悉“入口 → 网关 → 工具”的整条链路。

How to Install OpenClaw with Local Models on Windows 11
- 语言：英文
- 适合谁：想用本地模型体验“零 API 费用”的人。
- 你会学到：Windows 11 上安装、接入本地模型、跑通一次对话到执行。
Installing OpenClaw on Windows 10/11 – Step-by-Step Guide
- 适合谁：第一次装 OpenClaw，想跟着一步步做。
- 你会学到：基础安装流程与常见坑的绕法。

A2. macOS + 本地模型（Ollama / 本地推理）

特点：Mac 上“跑起来”相对顺手，尤其适合拿 Mac mini 做常驻的入门版。

How to Setup OpenClaw with Ollama on macOS (Zero API Cost)
- 语言：英文
- 适合谁：希望本地跑模型，先把整套流程打通。
- 你会学到：macOS 安装、Ollama 接入、零 API 费用跑通。
How to Setup OpenClaw on a Mac | Step-by-Step Walkthrough (2026)
- 适合谁：想要一份“从零到可用”的 Mac 端总览。
- 你会学到：安装与基础使用路径。

B. 目标是 24/7 常驻运行（VPS / Server 版本）

这类教程通常会涉及：

部署在 VPS 上
通道接入（Telegram/WhatsApp/企业 IM 等）
定时任务（Cron / Heartbeat）
安全加固（权限、审计、隔离）

如果你希望“像一个真正的助理一样一直在线”，再看这一类更合适。

B1. VPS / Server 上部署（从零到能用）

The Easiest Way To Install and Use OpenClaw For Beginners (VPS)
- 适合谁：想把 OpenClaw 跑在云服务器上，随时能用。
- 你会学到：VPS 部署流程、基础运行方式（视频中可能会夹带服务商推广，主要看步骤思路）。

B2. “一次性讲透”的长教程（更像全量课）

How to set up OpenClaw on Mac mini (full tutorial)
- 适合谁：准备把 Mac mini 当作低门槛“家庭小服务器”。
- 你会学到：从安装到接入通道、再到更接近长期运行的配置思路。

C. 专门避坑类（推荐收藏）

这类视频的价值是“少走弯路”。如果你装到一半卡住，优先翻这类。

Install OpenClaw on Windows THE RIGHT WAY
- 适合谁：Windows 上反复安装失败、依赖冲突、环境问题的人。
- 你会学到：更稳的安装顺序与常见坑位。

💡 怎么选最快：

你想“今天先跑起来看看”，就从 A1/A2（Ollama 本地模型） 开始。

你想“让它 24/7 像机器人一样常驻”，就直接看 B1（VPS），再补 C（避坑）。

参与讨论

返回文章列表