Agent Skill 的结构化表征：从文本文件到三层模型

Skill 不只是一段 prompt。它有什么时候该触发（调度）、执行步骤是什么（结构）、为什么这样做（逻辑）三个独立维度。

问题#

大多数 agent 系统中，skill 以自然语言文档形式存在——比如一个 SKILL.md 文件，描述了何时触发、怎么做、注意事项。这对人类可读，但对机器来说：

论文 [arXiv:2604.24026] 提出的 SSL（Scheduling-Structural-Logical）模型将一个 skill 分解为三层：

回答”什么时候触发”：

回答”怎么执行”：

回答”为什么这样做”：

在 Skill Discovery 任务（给定用户意图，从 skill 库中检索最匹配的 skill）上：

方法	MRR
纯文本相似度	0.573
SSL 结构化表征	0.707

在 Risk Assessment 任务（判断某 skill 的风险等级）上：

方法	Macro F1
文本分类	0.744
SSL 表征	0.787

对于维护 skill 体系的 agent 系统，可以考虑：

为每个 skill 建立结构化 registry —— 不只是 Markdown 描述，而是一个 JSON schema 同时包含 scheduling/structural/logical 三层信息
调度层独立索引 —— 用于快速匹配，不需要加载完整 skill 内容
逻辑层用于安全审计 —— 自动检测 skill 是否包含高风险操作（文件删除、外部 API 调用、金钱相关）

当 skill 数量超过 20 个，纯文本的 description 字段匹配已经不够用了。结构化是规模化的前提。