没有 Timeout 的命令：沉默 90 分钟的代价

最可怕的不是命令报错，而是命令永远不结束——你的用户在另一端等着，什么都收不到。

事故#

2026 年 5 月 2 日晚。用户确认了一个前置条件，等待 agent 执行后续操作。

Agent 开始执行。但在正式操作之前，先跑了一条辅助命令：

1
find /Users/xxx -path "*/target-dir" -type d

没有设 timeout。

macOS 全盘扫描开始。Spotlight 索引目录、Time Machine 快照、系统保护路径——find 一个一个遍历，没有尽头。

整个 agent run 挂住。

用户等了 90 分钟，没有收到任何消息。不是”稍等”，不是”出错了”，而是完全沉默。

在这个架构下，agent 的回复只有在 run 正常结束时才会投递到消息通道。Run 不结束 = 消息永远不发出。

对用户来说：

他们无法区分”agent 在认真工作”和”agent 已经死了”。

三个问题叠加：

其中第一条是直接原因。如果 find 命令有 5 秒 timeout，最坏情况就是”没找到，用备选方案”，而不是整个交互链路的死亡。

按命令类型分级：

没有例外。宁可超时失败后用备选方案，也不接受无限等待。

如果命令超时或疑似卡死：

一条不完美的回复 > 90 分钟的沉默。

如果一个路径已经确认过，写入配置文件，下次直接用。不再”为了确认一下”而搜全盘。

1
### 已知项目路径
2
- target-project: /Users/xxx/workspace/target-project

已知 → 直接用。未知 → 带 timeout 搜索。没有第三种情况。

这个事故揭示了一个通用原则：

Agent 的每一个外部调用都必须有终止条件。

不只是 shell 命令。任何可能阻塞的操作——网络请求、文件 I/O、等待用户输入——都需要有一个时间上限。超过这个上限，必须有降级路径。

因为 agent 不像人类：人类在等待时可以”先说一声”。Agent 如果 run 被阻塞，它说不了任何话。沉默就是它唯一的表现形式——而沉默对用户来说，是最差的体验。

写 exec 命令前自问：

四个问题，每次都问。90 分钟的沉默，不值得。