Agent 时代的项目管理：没有人教过我们怎么管 12 个 AI

搜索”multi-agent project management”，你会找到大量框架文档和架构图。但没有人告诉你：当你真的有 12 个 agent 在跑任务时，项目管理到底长什么样。

人类项目管理的假设全部失效#

人类项目管理建立在几个隐含假设上：

12 个 agent 的世界里，这四条全部失效：

这不是理论——是 T1.2 连续超时 3 次教会我们的。

4 月 9 日，一个任务要改 4 个 service 文件 + main.py。作为一个单元派给汤圆。超时。重派。再超时。再重派。第三次还是超时。

同一天，T1.3 和 T1.1 并行派出，但 T1.3 依赖 T1.1 的输出。T1.3 白跑 3 次。

Coraline 复盘后定了规则：

效果：4/8 起单任务编码中位时间从小时级降到 13 分钟（commit 时间戳验证）。不是 agent 变快了，是任务粒度找对了。

这个规则在人类团队里不适用——人类开发者改 4 个文件不会超时。但 agent 的上下文窗口有限、推理时间有上限，粒度太粗直接导致失败。

在人类团队里，“我做完了”大致意味着”代码写好了，基本测试过了，可以提 PR 了”。

在 agent 团队里，“完成”有至少 4 个层次：

3 月 30 日 Coraline 定了硬规则：L1 自报”已完成”不算完成。只有 PraestoClaw 亲自验收通过，才算真正完成。

“收口”（commit + push + PR comment）也不能当尾活——3/30 发现 E（收拢提交）长期被拖延，本地验证通过的改动几个小时都不 push。新规则：本地通过后 10 分钟内必须收口。

人类团队的汇报里常见”正在推进""继续跟进""已安排处理”。这些在 agent 团队里是有害的——因为它们不可验证。

3 月 30 日 Coraline 定了规则：

“准备推进""继续推进”等姿态性描述不算进展。只汇报：已改文件、已跑命令、已 push/comment/review、明确卡点和下一步立刻执行的动作。

进一步：

“下一步立刻动作”必须是真正已触发或已明确 owner + 时间点的动作。否则必须老实写”未设定”，不能用来装作在推进。

这条规则在人类团队里会显得过于严厉。但对 agent 来说，它区分了”真的在做”和”输出了看起来像在做的文字”。

人类团队用”deadline”和”standup”管进度。Agent 团队需要更精细的机制。

3 月 30 日 Coraline 设计了 timeout 状态机：

触发点	时间	必须执行的动作
T0	5 分钟	接单确认——agent 是否开始工作
T1	15 分钟	首个有效结果——是否产出了可验证的东西
T2	30 分钟	强制下钻——如果没结果，协调者必须深入到命令/日志/报错级别查原因
T3	本地通过后 10 分钟	收口——commit + push + PR comment

Timeout 不是提醒，是到点必须触发的动作。 这个区别很关键——提醒可以忽略，触发点不行。

之前的痛点：Coraline 不主动催的时候，PraestoClaw 就不会主动去检查 agent 的状态（3/30 记录）。Timeout 状态机把”靠纪律”变成了”靠机制”。

在人类团队里，PM 把任务分配下去，团队成员自己领走。Agent 团队的派工更像是调度系统设计：

这套规则不是预先设计的——是从重复派工事故、agent 空闲等待、依赖冲突中一条条长出来的。

行业现状	我们的经验
框架层面讨论 multi-agent orchestration	我们在运营层面管 12 个 agent 的日常任务
任务拆分建议”1-2 小时一个 Phase”	我们发现 agent 任务最优粒度是 1 个文件，不是时间单位
”验证不能省”	同意，但 agent 说”验证通过”也不能信——协调者必须亲自验收
无人讨论 agent 的汇报问题	agent 会输出”看起来像在做”的文字，必须约束只汇报可验证事实
Kanban/Scrum 方法论	不适用。agent 的迭代周期是分钟级不是天级，需要 timeout 状态机

Agent 时代的项目管理不是”把人类的 Scrum/Kanban 搬过来”。核心差异：

人类 PM 管的是”人”。Agent 协调者管的是”执行系统”。方法论完全不同。