Agent Skills：AI 世界的 App Store 正在成型

前两篇我们一直在聊 OpenClaw——它是什么、怎么跑起来的、以及 1,100 个暴露端口背后的安全教训。

但有一个东西我们反复提到却一直没展开讲：Skills。

OpenClaw 内置 100 多个 Skills。Anthropic 把 Skills 做成了开放标准。SkillsMP 上已经有超过 17 万个开源 Skills。

这些数字背后有一个很大的问题：

Skills 到底是什么？它和 MCP 什么关系？为什么有人说它是 AI 的 “App Store 时刻”？

今天把这件事讲清楚。

先回答一个最基本的问题

你让 ChatGPT 帮你做一件事，它会怎么做？

靠训练数据里的通用知识，临场发挥。运气好的话结果还行，运气不好就完全跑偏——因为它不知道你的具体场景、你的行业规范、你的工作流程。

Skills 解决的就是这个问题。

一个 Skill 就是一份”操作手册”，告诉 Agent：遇到某类任务时，应该按什么步骤、用什么工具、注意什么边界条件。

不是让 Agent 临场发挥，而是让它照着菜谱做菜。

一个 Skill 长什么样？

说起来你可能不信，一个 Skill 就是一个文件夹，里面放一个 Markdown 文件。

文件叫 SKILL.md，结构大概是这样：

开头用 YAML 写几行元数据——名字、描述、协议、作者。然后正文用 Markdown 写具体的操作指南——步骤说明、输入输出示例、常见坑怎么绕。

如果需要，文件夹里还可以放脚本（比如一个 Python 文件）、参考文档、模板等辅助材料。

就这样。没有复杂的 SDK，没有要跑起来的 Server，没有 JSON-RPC 协议。

文件夹即技能，Markdown 即接口。

这也是为什么 Skills 的生态增长这么快——写一个 Skill 的门槛极低。你会写 Markdown，你就会写 Skill。

谁在用 Skills？

Anthropic 最早把 Skills 做成了开放标准，发布在 agentskills.io。但它不是 Anthropic 的专属格式——现在的兼容阵营已经很广了：

Claude Code：Anthropic 自家的编码 Agent，Skills 是核心扩展机制
OpenAI Codex CLI / ChatGPT：OpenAI 也采纳了同一标准，Skills 现在横跨 Anthropic 和 OpenAI 两大生态
Cursor：最火的 AI 编程工具之一，原生支持 Skills 发现和加载
GitHub Copilot：微软系，也已经兼容
Windsurf：Cognition 出的 AI 开发环境
OpenClaw：我们前两篇聊的那位，100+ 内置 Skills

一个 Skill 写一次，这些工具都能用。Anthropic 和 OpenAI 支持同一个开放格式——这两家公司几乎在所有事情上都唱反调，但在这件事上达成了共识，足以说明标准化的压力有多大。以前每个平台的插件格式都不一样，现在有了统一标准。

Skills vs MCP：别再搞混了

这个问题被问了无数遍，我们彻底说清楚。

Skills vs MCP 对比

MCP（Model Context Protocol） 是让 AI 调用外部工具和 API 的协议。你可以把它理解成万能插座——Agent 通过 MCP 连上数据库、连上浏览器、连上 Slack、连上你的文件系统。

MCP 现在有多火？月度 SDK 下载量 9700 万次，活跃 Server 超过 10,000 个。去年 12 月被捐赠给 Linux 基金会，正式成为行业标准。

Agent Skills 是教 Agent 怎么用这些工具的”操作手册”。你可以把它理解成使用指南——“遇到要分析 PDF 的需求时，先用 OCR 工具提取文本，再用结构化解析拿到表格，最后用模板生成摘要报告”。

区别在哪？

MCP 给 Agent 能力——“你能连这个数据库了”。

Skills 给 Agent 智慧——“连上数据库之后该查什么表、怎么写 SQL、结果怎么呈现”。

如果只给 Agent 一堆 MCP 工具，它就像一个新手拿到了满屋子的专业工具——电钻、示波器、车床都有，但不知道该先拿哪个。

Skills 就是那个老师傅，站在旁边告诉它：“你现在要做的是这个，先拿那个工具，按这个顺序操作。”

所以两者不是竞争关系，是搭档关系。 Skills 编排 MCP 的使用时机和方式，MCP 提供实际的执行能力。

开发体验差多少？有个工程师在博客里记录了这样一件事：他先用 MCP 标准流程搭了一个完整的 Server——JSON-RPC 协议、服务端基础设施、错误处理，该有的都有。然后他用一个 Markdown Skill 文件重新实现了同样的功能，花了两小时，效果一样。MCP 是强大的基础设施，Skills 是快速的领域知识。

但大多数人忽略了一件事：Skills 和 MCP 之间还需要一个控制平面。 得有什么东西来加载正确的 Skills、路由 MCP 工具调用、执行安全策略、管理会话状态。这个”什么东西”就是 Agent Gateway——编排层，我们后面会详细讲。

渐进式加载：Skills 最聪明的设计

Skills 还解决了一个很现实的问题：Token 太贵了。

MCP 的做法是把所有工具定义预先加载到 Agent 的上下文里。1000 个 MCP 工具大概要消耗 15 万个 tokens——还没开始干活呢，光”认识工具”就烧了一大笔钱。

Skills 换了一个思路，叫渐进式加载。

Agent 刚启动的时候，只看每个 Skill 的名字和一句话描述——大概 100 个 tokens。

用户提了一个需求，Agent 判断哪几个 Skill 可能相关，才去加载它们的完整内容——每个不到 5000 个 tokens。

真正执行的时候，再按需加载脚本和参考文档。

这个”先浏览菜单、再看菜谱、最后才进厨房”的设计，让 Token 消耗降低了 98% 以上。

当你要管理上千个能力的时候，这个差距就是能不能跑得动的区别。

还有一个更深层的原因。ACL 2025 上发表的 SMART 框架发现了一个反直觉的结论：工具调用越少，Agent 反而做得越好。减少 24% 的工具调用，任务准确率提升了 37%——甚至让 70 亿参数的模型追平了 GPT-4o 的表现，只用了五分之一的工具调用量。原因不复杂：当 Agent 不用在 1000 个工具定义里大海捞针的时候，它对”该用哪个”的判断就更准。渐进式加载不只是省钱，它让 Agent 变聪明了。

17 万个 Skills：App Store 时刻来了吗？

SkillsMP（Agent Skills Marketplace）上目前已经有 超过 17 万个 开源 Skills。

覆盖的领域很广：

DevOps：容器管理、CI/CD 流水线、基础设施自动化（11,000+）
软件开发：代码审查、测试生成、技术债务清理（19,500+）
数据 & AI：模型训练、数据分析、LLM 工作流（13,000+）
商业运营：项目管理、销售/营销、财务运营（11,800+）
安全审计：漏洞扫描、合规检查、威胁建模（8,100+）
生产力 & 文档：邮件处理、会议纪要、技术写作（5,700+）

这个数字还在快速增长，因为创建 Skill 的门槛实在太低了。

值得注意的是：已经有超过 17,500 个 Skills 面向非开发者场景——商业运营、文档处理、项目管理。这个生态已经不只是开发者的游乐场了。

但说实话，现在的 Skills 生态更像是 2008 年的 App Store——数量上来了，质量参差不齐，发现机制还很原始。

你去 SkillsMP 上找 Skill，体验跟早期的应用商店差不多：一堆列表，有些写得很好，有些就是个标题加两行字，你得自己翻、自己试。

缺什么？ 缺一个好的推荐系统，缺场景化的引导（“你是做财务的？这五个 Skill 组合起来能帮你自动对账”），缺质量评分，缺一键安装的体验。

谁把这些做好，谁就是 Agent 世界的 App Store。

2026 年的新变化

Skills 和 MCP 的生态在 2026 年都在快速进化。几个值得关注的动向：

MCP 进入 Linux 基金会

去年 12 月，Anthropic 把 MCP 协议捐赠给了 Linux 基金会旗下的 Agentic AI Foundation。AWS、Google、Microsoft、OpenAI 都成了白金会员。这意味着 MCP 不再是 Anthropic 的私有协议，而是行业公共基础设施了。

MCP Apps

以前 MCP 工具只能返回文本。现在它能返回交互式 UI——仪表板、表单、数据可视化。Agent 不再只能在终端里干活，它可以给你画一个界面出来。

Docker MCP Catalog

Docker 推出了 200 多个预审计的 MCP 工具，跑在容器化的安全环境里。这解决了一个关键的信任问题：你怎么知道一个社区贡献的 MCP Server 不会偷你数据？Docker 的答案是沙箱 + 审计。

Skills 的 Slash Command 化

在 Claude Code 和 Cursor 里，Skills 已经变成了可以直接用 /skill-name 调用的快捷指令。从”被动匹配”变成了”主动调用”，使用体验更像 Slack 的斜杠命令。

我们在做什么

讲了这么多行业的事，说说我们自己——以及为什么我们觉得这条路走得通。

缺失的那一层：Agent Gateway

Skills 定义了”做什么”，MCP 提供了”用什么做”。但中间还需要一层——加载正确的 Skills、路由 MCP 工具调用、执行安全策略、管理会话状态、记录审计日志。行业把这一层叫 Agent Gateway：一个专门为自主、多步骤 Agent 任务设计的治理和编排层。

Agent 能力栈：Skills + Gateway + MCP

这不是我们自己发明的概念。TrueFoundry、Gartner 2025 报告、以及多篇学术论文（MCP-SandboxScan 做 WASM 沙箱、AgentArmor 做运行时轨迹分析、A2AS 提出”Agent 的 HTTPS”安全模型）都指向同一个结论：Gateway 是 Agent 世界的操作系统内核。

OpenClaw 的 Gateway 跑在 localhost:18789，是一次早期尝试——上一篇我们讲了，这个内核跑在你的笔记本上不设防会怎样。1,100 个端口暴露在公网。

AgentPuter 在做的是一个专业的、云端的 Agent Gateway：沙箱执行、声明式权限策略、持久化状态、完整可观测性。

杀手级应用：Office Skills

这里有一个历史类比特别有意思。Windows 不是靠操作系统内核本身赢的，它靠的是两类应用：

Office（Excel、Word、PowerPoint）——驱动企业采购。公司必须买 Windows，因为 Office 只在 Windows 上跑得最好。
游戏（DirectX、扫雷、纸牌）——驱动消费者购买。个人用户想要 Windows，因为游戏在这里。

Agent 生态正在走同样的路。“内核”（Gateway）很重要，但真正把用户拉到平台上的是杀手级 Skills。

17 万个 Skills 里面，大部分面向开发者。但微软 2025 年 Copilot 使用报告显示：桌面端工作时间（8am-5pm）工作相关查询绝对主导，移动端健康/生活查询全天排名第一，周末娱乐查询飙升。

我们的判断：Office Skills 就是 Agent 世界的 “Microsoft Office 时刻”。

写文档、做表格、排 PPT、发邮件、整理会议纪要——这是大多数人每天花时间最多的事。我们在做一组面向办公场景的 Skills：

你说”帮我把这个季度的销售数据做成图表”，Agent 直接交付一个排好版的 Excel
你说”把昨天会议的录音整理成纪要”，Agent 直接给你一份结构化的文档
你说”这份合同帮我看看有没有风险条款”，Agent 直接标注出来

不是”我帮你想想怎么做”，而是”做好了，你看一下”。

逻辑很清楚：先建好运行时（Gateway），再上杀手级应用（Office Skills），然后让生态飞轮自己转起来。

写在最后

回顾一下这个系列：

第一篇，我们说 OpenClaw 解决了一个真实痛点——让 AI 从”动嘴”变成”动手”。

第二篇，我们拆了 OpenClaw 的架构，发现 Brain-Body-Soul 的切分很精妙，但安全和可靠性是硬伤。

这一篇，我们把视角从 OpenClaw 拉到了整个生态。浮现出来的图景有三层：

Skills 是应用，MCP 是 API，Gateway 是操作系统。

模型会越来越便宜，MCP 工具会越来越多，Skills 还在飞速增长——17 万只是开始。但如果没有一个编排层把这些安全、可靠地串起来，一切都是空中楼阁。

每一个大的计算平台都走过同样的路：一个”能跑就行”的 OS 内核，加上让人愿意留下来的杀手级应用。Windows 有内核 + Office + DirectX。iOS 有内核 + App Store + 几个爆款应用。Agent 平台也会有 Gateway + Skills + 属于它的杀手级场景。

我们赌的是：这个杀手级场景从办公开始——因为这是大多数知识工作者每天花时间最多的事。把 Gateway 建好，把对的 Skills 做出来，飞轮就会转起来。

从 OpenClaw 到 Skills 再到 Agent 能力栈——三篇文章走了一条线：从一个产品 → 到它的架构 → 到底层的平台逻辑。接下来，我们会更具体：特定 Skills 怎么改变日常工作流，以及”Vibe Working”到底是什么样的体验。如果你有感兴趣的场景，欢迎留言。