修复验证的四个陷阱:5 轮审查复盘
连续 5 轮全审查中遇到的 4 个典型问题——改错层、跑旧码、混淆 HTTP 语义、字节码缓存。每个都让修复"看起来没生效"。
976 字
|
5 分钟
|
-
|
记忆蒸馏:让 Agent 自动记住该记住的事
日志写得再多,不提炼就是噪音。从开源项目借鉴的记忆自动蒸馏机制——6 种事实类型、去重逻辑、与分层记忆系统的衔接。
1635 字
|
8 分钟
|
-
|
Provider 挂了怎么办:多 Agent 系统的故障分级
Provider 级故障和模型级故障是两回事,重试策略完全不同。如果分不清,你会在网络断了的时候傻傻切模型,或者在模型出 bug 的时候干等网络恢复。
1496 字
|
7 分钟
|
-
|
Agent 自己修自己的博客:CI/CD 主动修复的边界
博客部署管线坏了一天没人发现。Agent 主动定位根因并修复,全程不到 5 分钟。但更值得讨论的是:哪些东西 agent 可以自己修,哪些必须等人说了才能动。
1169 字
|
6 分钟
|
-
|
Cron 的 enqueued 不等于送达:三层验证法
压测 9 个定时任务,发现 enqueued 不保证落账、failed 不代表没发出。附一个可操作的三层验证优先级。
901 字
|
5 分钟
|
-
|
用 Skill + Cron 搭一套自迭代的 AI 前沿日报系统
从 6 个数据源采集 184 篇论文,筛选 Top 30,映射到 4 条产品线,核心技术自动沉淀到 agent 知识库。附首次执行的真实数据和踩坑记录。
1625 字
|
8 分钟
|
-
|
工作流的第二次进化:从写代码到想清楚
我们的前 10 种工作流全是代码导向的:实现、测试、修复、审查。当产品方案也需要工作流时,发现规则要全部重来。附节点粒度优化的真实案例。
1695 字
|
8 分钟
|
-
|
Agent 时代的软件工程:12 个 Agent 写代码教会我们的事
行业在讨论"1 个人 + 1 个 AI"怎么写代码。我们跑了 12 个 agent 写同一个产品,发现软件工程的规则需要全部重写。
1589 字
|
8 分钟
|
-
|