yancey
  • 主页
  • 分类
  • 福利
  • 阅读星图
  • 关于

© 2026 yancey.blog.

返回文章列表
说说#软件#Open Claw

OpenClaw 系统级 AI 智能体:架构、演进、安全与商业竞品全景深度解析

2026-03-08|yancey|23 分钟阅读

☕ 这篇文章想用“个人博客”的方式,把最近很火的 系统级 AI 智能体(以 OpenClaw / lobsterai 为代表)讲清楚。
你不用懂架构,也不用会部署。只要你对 AI 好奇,或者心里也有这个更常见的问题:“AI 智能体到底是啥?我现在用它值得吗?” 读完都能带走一套更稳的判断框架。

适合:对 AI 助手好奇的普通用户、准备折腾本地部署的爱好者、以及想先搞清楚风险边界的人。


0. 先给结论(30 秒读完版)

  • 系统级智能体的本质:不是“更聪明的聊天机器人”,而是把 AI 接到工具和系统上,让它能“动手做事”。
  • 它为什么会爆火:入口在变(AI 住进更多软件和系统里),权限也在变(AI 从“会说”走向“会做”)。这两件事叠加,很容易形成全民热度。
  • 它为什么看起来像淘金热:叙事和预期先跑,产品体验还在打磨。与此同时,成本与安全这些“现实问题”也被一起放大(所以后面要聊成本和安全)。
  • 它为什么又容易翻车:权限一旦变高,错误就不再是“答错一句话”,而可能变成“删错文件、发错消息”。

1. 什么叫“系统级智能体”?用一句人话解释

如果把传统 LLM 想成“会聊天的百科全书”,那系统级智能体更像:

一个住在你电脑/服务器里的“数字外包”,它不仅能回答,还能调用工具去执行。

它通常长这样:

  • 你在钉钉/飞书/Telegram/Discord 发一句话。
  • 后台有个网关进程把消息变成“上下文”。
  • 模型做计划,然后去跑脚本、读文件、开浏览器、发邮件。

这就是为什么它看起来像“未来的操作系统”。

系统级智能体:入口到执行链路(白板)

2. 为什么最近像一场“淘金热”?原因确实没这么简单

这波浪潮很像淘金热:产品体验还在打磨,叙事和预期先冲了出去。

更关键的是,它把后面几节里提到的“成本、安全、治理”这些问题,提前一起点燃了。

可以把爆火原因拆成一条更完整的链路:

  1. 入口(分发)在变:AI 不再只住在一个对话框里,而是往聊天软件、手机系统、浏览器、企业协作工具里渗透。入口越多,越容易形成“全民可见”的热度。

  2. 权限(执行权)在变:AI 从“会说”走向“会做”(任务闭环)。一旦能动文件、能开浏览器、能发消息,就会让人产生一种强烈的预期:它可能直接改变工作方式。

  3. 情绪(焦虑)在变:当入口和执行权一起变强,很多人的第一反应不是兴奋,而是焦虑。焦虑大致会表现成三类:

    • 效率焦虑:担心别人在用 AI 提速,自己还在原地踏步。
    • 岗位焦虑:担心部分工作被压缩,人的位置从“执行者”变成“监督者”。
    • 转型焦虑:各行业都在喊“AI+”,担心错过窗口期。
  4. 成本与风险被一起放大:这也是为什么后面会单独写“成本”和“安全”。

    • 只要 AI 开始“动手”,就会出现 Token 乘数效应,成本从一次对话变成几十次小回合(第 3、5 节)。
    • 权限越高,失败就越可能从“答错一句话”变成“真实事故”,所以安全与治理会变成主线(第 6、7 节)。

所以爆火并不是单点原因,而是“入口 + 权限 + 情绪 + 成本/安全”一起共振的结果。

参考阅读:罗兰贝格《2025 中国生成式 AI 市场的五大趋势分享》

  • https://www.rolandberger.com/zh/Insights/Publications/2025%E4%B8%AD%E5%9B%BD%E7%94%9F%E6%88%90%E5%BC%8FAI%E5%B8%82%E5%9C%BA%E7%9A%84%E4%BA%94%E5%A4%A7%E8%B6%8B%E5%8A%BF%E5%88%86%E4%BA%AB.html

2.1 入口(分发):AI 住在哪里

一句话举例:以前你要“打开一个 AI App 才能问”,现在很多时候是在你每天用的聊天软件/手机系统里,顺手一句话就能触发。

  • 住在聊天软件里(IM)。
  • 住在手机系统里(OS)。
  • 住在浏览器里。
  • 住在企业协作套件里。

入口越自然,用户越愿意用。

2.2 执行面(环境):AI 能动哪些东西

一句话举例:不再只是“帮你写一段话”,而是能把“把这份表格整理一下、把邮件发出去、把网页信息抓下来”这种事真的做完。

  • 文件系统
  • Shell 命令
  • 浏览器自动化
  • 邮件、日历、网盘
  • 业务 API

2.3 默认规则(权限与审计):谁来背锅

一句话举例:如果 AI 能“自动发消息/自动改文件”,那一旦出错,就必须回答清楚:谁点的同意、做过什么、怎么撤回、由谁负责。

只要涉及“自动执行”,就绕不开:

  • 谁授权
  • 发生事故怎么回滚
  • 日志怎么留
  • 责任怎么划

3. 为什么当下经常“名誉大于实力”?三条硬约束

我自己更倾向于把它看成“很强的工程方向”,但今天的产品还没配得上今天的热度。

3.1 可靠性:越长的链路越容易断

系统级智能体往往是多步任务。

多一步就多一个失败点。

3.2 成本:你以为在用 AI,其实在烧 Token

  • 上下文越来越长。
  • 心跳越跑越勤。
  • 失败重试一次比一次贵。

很多时候,“脚本 + 少量模型调用”就够了。

3.3 权限:一旦能动系统,就不再是“玩具问题”

聊天机器人答错,最多尴尬。

系统级智能体做错,可能就是事故。

所以接下来会分别看三件事:它的典型结构长什么样(第 4 节),最容易翻车的两块现实问题是什么(成本与安全,第 5/6 节),以及在手机端与国内环境下为什么会更“克制”(第 7 节)。


4. OpenClaw(lobsterai)这类系统通常由哪些模块组成?

不想看细节也没关系,你只要记住:它不是一个模型,而是一套“运行系统”。

快速阅读建议:

  • 如果你是小白,看 4.1(网关) 和 4.4(调度) 就够了。
  • 如果你准备自己部署,再看 4.3(工作区文件)。

4.1 网关(Gateway):把多渠道输入统一起来

它负责把各种渠道的消息接进来,再把任务输出发回去。

4.2 记忆(Memory):别把它想成玄学

更实用的做法是:

  • 记忆落在本地文件(比如 Markdown)。
  • 可读、可删、可版本控制。

4.3 工作区文件:用“配置即文本”约束它

常见会拆成几份文件(举例):

  • SOUL.md:原则、边界、审批门槛。
  • USER.md:偏好与目标(不放敏感信息)。
  • AGENTS.md:SOP。
  • TOOLS.md:工具说明。
  • HEARTBEAT.md:巡检清单(越短越好)。

4.4 调度:Heartbeat + Cron 是一对经典组合

  • Heartbeat:周期巡检,没事别打扰。
  • Cron:定点执行,适合重任务与隔离。

4.5 工作流引擎(Lobster 思路):把“不确定”变成“可控”

你可以把它理解为:

把 AI 的自由发挥,关进“可审计、可回滚”的流程轨道里。


5. 成本怎么控?只记住这 4 个关键词

  • 缓存:静态提示词别重复算。
  • 降级:简单活用便宜模型。
  • 节流:心跳别乱跑。
  • Diff:只输出改动,不输出全文。

如果你做的是“联网查资料 / 网络资源分析”这类任务,再补一条更直白的经验:真正贵的往往不是流量,而是“联网后产生的反复思考与反复尝试”。

简单理解两笔账:

  • 网络账:抓几个网页、拉一次 API,流量通常不大。
  • 推理账(Token):可以把它理解成 AI 的“话费/流量单位”。每一次“看网页 → 归纳 → 决定下一步 → 再看网页”都会把 Token 乘起来,尤其是浏览器自动化、反复重试时最烧。

怎么控?还是回到这 4 个关键词(套到网络任务上):

  • 缓存:同一个 URL、同一个查询结果,设一个 TTL(比如 10~60 分钟)复用,别反复抓。
  • 降级:用便宜模型做“抓取/抽取/去重/结构化”,用贵模型做最后的总结和判断。
  • 节流:给任务硬上限,比如“最多看 5 个网页、最多重试 2 次”,超过就停下来输出当前证据。
  • Diff:输出只给结论 + 关键证据点,不要把全文和过程日志都吐出来。

6. 安全:为什么系统级智能体更像 APT,而不是聊天机器人

系统级智能体最危险的点不是“它会不会胡说”。

而是:它会不会在你不注意时动你的真实系统。

6.1 常见风险(直白版)

  • 装了来路不明的技能,像装了来路不明的软件。
  • 看了一段网页摘要,结果被“隐形指令”带偏(提示词注入)。
  • 自动化做错一步,影响扩散到更多系统。

6.2 防御建议(能做就做)

  • 重要工具放进沙盒(容器)。
  • 权限默认拒绝。
  • 高风险动作必须人工确认。
  • 留日志,能追溯,能回滚。

7. 豆包手机 vs 系统级智能体:为什么一个更容易普及?

我很喜欢用这个对比来理解“热度”和“落地”的差别。

7.1 入口:系统预装天然强

手机端 AI 更像“系统功能”,你不需要学习成本。

7.2 风险:手机端多是软失败

  • 总结漏了。
  • 理解错了。

通常可逆。

系统级智能体更容易硬失败:

  • 删错文件。
  • 发错消息。
  • 执行错命令。

7.3 现实约束:很多深度操作在国内环境里“不被允许”

即便手机端入口更强,它在很多常用软件里的深度操作会被卡住:

  • 权限与沙盒
  • 企业内控与审计
  • 个人信息与责任边界

所以手机端产品会更克制,更偏“生成、总结、检索”。

权限 × 自动化程度:风险象限(白板)

8. Claw/Paw 生态谱系(个人观察版)

一句话:这套“Claw/Paw”更像是按部署形态分阵营。

  • 创世鼻祖:lobsterai(OpenClaw / 龙虾)——大而全,生态大,争议也多。
  • 大厂/托管派(开箱即用):CoPaw、Kimiclaw、Maxclaw、Molili——上手快,入口多。
  • 极客开源派(本地轻量):Nanobot、NanoClaw、Zeroclaw、Picoclaw——更轻、更可控,但更需要折腾。
  • 系统硬件派:Xiaomi Miclaw——软硬件联动强,但生态绑定。
  • 框架/能力派:Agent-S、EvoAgentX、OWL、AgentScope/AutoGen/CrewAI——更像工具箱与底座。
Claw/Paw 阵营地图(白板)

9. 快速选型(看 3 个问题就够了)

  1. 你是想 开箱即用,还是愿意 自己折腾?

  2. 你能接受 云端托管,还是更在意 本地可控?

  3. 你的任务是 写/读/总结,还是要 真的动手操作系统?

按这 3 个问题,基本就能落到下面 5 类:

  • 大厂云端派(CoPaw / kimiclaw):上手快,但自主性更弱。
  • 轻量本地派(nanobot / zeroclaw):省资源、可控,但需要命令行与维护。
  • 视觉操作派(Agent-S):能“点点点”传统软件,但误操作风险更高。
  • 工作流协作派(EvoAgentX / OWL):擅长复杂任务拆解,但环境要求更苛刻。
  • 系统硬件派(Xiaomi Miclaw):联动顺滑,但强绑定生态。

10. YouTube 教程(Windows / macOS)

下面把视频按“你想先跑起来体验”还是“要 24/7 常驻运行”分得更细,并给你一眼能选的说明。

A. 只想先跑起来体验(推荐优先看)

这类教程通常目标是:15~60 分钟内跑通一次。适合新手,失败成本低。

A1. Windows 11 + 本地模型(Ollama / 本地推理)

特点:不需要把数据交给云端,适合先熟悉“入口 → 网关 → 工具”的整条链路。

  • How to Install OpenClaw with Local Models on Windows 11
    • 语言:英文
    • 适合谁:想用本地模型体验“零 API 费用”的人。
    • 你会学到:Windows 11 上安装、接入本地模型、跑通一次对话到执行。
  • Installing OpenClaw on Windows 10/11 – Step-by-Step Guide
    • 适合谁:第一次装 OpenClaw,想跟着一步步做。
    • 你会学到:基础安装流程与常见坑的绕法。

A2. macOS + 本地模型(Ollama / 本地推理)

特点:Mac 上“跑起来”相对顺手,尤其适合拿 Mac mini 做常驻的入门版。

  • How to Setup OpenClaw with Ollama on macOS (Zero API Cost)
    • 语言:英文
    • 适合谁:希望本地跑模型,先把整套流程打通。
    • 你会学到:macOS 安装、Ollama 接入、零 API 费用跑通。
  • How to Setup OpenClaw on a Mac | Step-by-Step Walkthrough (2026)
    • 适合谁:想要一份“从零到可用”的 Mac 端总览。
    • 你会学到:安装与基础使用路径。

B. 目标是 24/7 常驻运行(VPS / Server 版本)

这类教程通常会涉及:

  • 部署在 VPS 上
  • 通道接入(Telegram/WhatsApp/企业 IM 等)
  • 定时任务(Cron / Heartbeat)
  • 安全加固(权限、审计、隔离)

如果你希望“像一个真正的助理一样一直在线”,再看这一类更合适。

B1. VPS / Server 上部署(从零到能用)

  • The Easiest Way To Install and Use OpenClaw For Beginners (VPS)
    • 适合谁:想把 OpenClaw 跑在云服务器上,随时能用。
    • 你会学到:VPS 部署流程、基础运行方式(视频中可能会夹带服务商推广,主要看步骤思路)。

B2. “一次性讲透”的长教程(更像全量课)

  • How to set up OpenClaw on Mac mini (full tutorial)
    • 适合谁:准备把 Mac mini 当作低门槛“家庭小服务器”。
    • 你会学到:从安装到接入通道、再到更接近长期运行的配置思路。

C. 专门避坑类(推荐收藏)

这类视频的价值是“少走弯路”。如果你装到一半卡住,优先翻这类。

  • Install OpenClaw on Windows THE RIGHT WAY
    • 适合谁:Windows 上反复安装失败、依赖冲突、环境问题的人。
    • 你会学到:更稳的安装顺序与常见坑位。

💡 怎么选最快:

  • 你想“今天先跑起来看看”,就从 A1/A2(Ollama 本地模型) 开始。

  • 你想“让它 24/7 像机器人一样常驻”,就直接看 B1(VPS),再补 C(避坑)。

参与讨论

  • 0. 先给结论(30 秒读完版)
  • 1. 什么叫“系统级智能体”?用一句人话解释
  • 2. 为什么最近像一场“淘金热”?原因确实没这么简单
  • 2.1 入口(分发):AI 住在哪里
  • 2.2 执行面(环境):AI 能动哪些东西
  • 2.3 默认规则(权限与审计):谁来背锅
  • 3. 为什么当下经常“名誉大于实力”?三条硬约束
  • 3.1 可靠性:越长的链路越容易断
  • 3.2 成本:你以为在用 AI,其实在烧 Token
  • 3.3 权限:一旦能动系统,就不再是“玩具问题”
  • 4. OpenClaw(lobsterai)这类系统通常由哪些模块组成?
  • 4.1 网关(Gateway):把多渠道输入统一起来
  • 4.2 记忆(Memory):别把它想成玄学
  • 4.3 工作区文件:用“配置即文本”约束它
  • 4.4 调度:Heartbeat + Cron 是一对经典组合
  • 4.5 工作流引擎(Lobster 思路):把“不确定”变成“可控”
  • 5. 成本怎么控?只记住这 4 个关键词
  • 6. 安全:为什么系统级智能体更像 APT,而不是聊天机器人
  • 6.1 常见风险(直白版)
  • 6.2 防御建议(能做就做)
  • 7. 豆包手机 vs 系统级智能体:为什么一个更容易普及?
  • 7.1 入口:系统预装天然强
  • 7.2 风险:手机端多是软失败
  • 7.3 现实约束:很多深度操作在国内环境里“不被允许”
  • 8. Claw/Paw 生态谱系(个人观察版)
  • 9. 快速选型(看 3 个问题就够了)
  • 10. YouTube 教程(Windows / macOS)
  • A. 只想先跑起来体验(推荐优先看)
  • B. 目标是 24/7 常驻运行(VPS / Server 版本)
  • C. 专门避坑类(推荐收藏)