2026年4月24日MonitoringAgent-OperableOpen Source

CC-Canary应该是每个Agent产品的标配

Anthropic 4月23日的事故复盘承认Claude Code有一次退化,外部没人干净地抓到。CC-Canary两天后就放出来了,正是那块缺的拼图。两个可安装的Claude Code skill,去~/.claude/projects/把会话日志走一遍,用跟ccusage一样的方案去重assistant回合,然后算每日健康指标。读写比。写操作占所有改动的比例。每千次工具调用里的推理循环。thinking redaction率。平均thinking长度。

输出是每日合成分加一个拐点探测器,给每一天贴标签——HOLDING、SUSPECTED REGRESSION、CONFIRMED REGRESSION、INCONCLUSIVE。预渲染为markdown或交互HTML。纯本地跑。零网络调用。零telemetry。不用登哪个看板。

仓库很小——11个star,0.x pre-alpha,纯Python——但模式才是要点。第三方对着前沿Agent产品做漂移检测这件事,成了一个新工种。Anthropic有自己的eval suite,用户没有。之前能做的极限就是上Twitter开骂或者取消订阅,Nicky Reinert今早693分的HN帖子对Anthropic干的就是后者。

这正是Agent可观测性这层在成形的样子。不是给AI团队内部用的看板。是给AI用户的发货级工具,用自己的数据在自己的机器上自己的工作流里抓模型行为变化。每一个Agent产品发布60天内都该有一个类CC-Canary的东西围绕它出现。

https://github.com/delta-hq/cc-canary
← 上一篇
Browser Harness,592行Python让Agent自己长工具
下一篇 →
Beezi AI,给AI编码算账的那层
← 返回所有文章

评论

加载中...
>_