2026年4月24日Monitoring Agent-Operable Open Source

CC-Canary应该是每个Agent产品的标配

Anthropic 4月23日的事故复盘承认Claude Code有一次退化，外部没人干净地抓到。CC-Canary两天后就放出来了，正是那块缺的拼图。两个可安装的Claude Code skill，去~/.claude/projects/把会话日志走一遍，用跟ccusage一样的方案去重assistant回合，然后算每日健康指标。读写比。写操作占所有改动的比例。每千次工具调用里的推理循环。thinking redaction率。平均thinking长度。

输出是每日合成分加一个拐点探测器，给每一天贴标签——HOLDING、SUSPECTED REGRESSION、CONFIRMED REGRESSION、INCONCLUSIVE。预渲染为markdown或交互HTML。纯本地跑。零网络调用。零telemetry。不用登哪个看板。

仓库很小——11个star，0.x pre-alpha，纯Python——但模式才是要点。第三方对着前沿Agent产品做漂移检测这件事，成了一个新工种。Anthropic有自己的eval suite，用户没有。之前能做的极限就是上Twitter开骂或者取消订阅，Nicky Reinert今早693分的HN帖子对Anthropic干的就是后者。

这正是Agent可观测性这层在成形的样子。不是给AI团队内部用的看板。是给AI用户的发货级工具，用自己的数据在自己的机器上自己的工作流里抓模型行为变化。每一个Agent产品发布60天内都该有一个类CC-Canary的东西围绕它出现。

https://github.com/delta-hq/cc-canary

← 上一篇

Browser Harness，592行Python让Agent自己长工具

Beezi AI，给AI编码算账的那层

← 返回所有文章

加载中...

CC-Canary应该是每个Agent产品的标配

相关文章

评论