2026年4月30日AgentsResearchFramework

快手扁鹊:跑在线上的agentic运维,告警量降75%

快手今天发了扁鹊,一个一直在他们电商搜索引擎上做运维的agentic框架。数字不是沙盒里的:告警量降75%,根因分析准确率80%,MTTR降一半以上。作者包括Bochao Liu、Chenyi Lei、Xiao Liang,还有十个快手搜索团队的人。

框架对问题的framing才是值得抬出来的部分。运维大型线上系统的瓶颈不在推理。瓶颈在编排:对任何一个告警,agent应该看哪一片遥测数据、哪些历史事件相关、应该用哪个runbook。扁鹊的答案是Flexible Skill Arrangement——skill声明它在哪个业务场景下需要什么数据和知识,框架在运行时把对的上下文wire到对的skill上,而不是把所有东西一股脑灌到prompt里。

这是那种六个月前发不出来的论文,因为没人有这种规模的生产agent运维可以写。上一波是检索增强的事件chat。扁鹊更接近一个真的SRE——它做诊断、它跑流程、它缩告警队列。告警降75%不是能编出来的那种数。

生产结果就是编辑点。大多数agent论文报benchmark。扁鹊报的是中国最大的视频和电商平台之一上的部署系统。2026年任何在做agentic运维的人,下一版上线之前都该读一下skill arrangement那一节。代码:https://github.com/benchen4395/BianQue_Assistant 论文:https://arxiv.org/abs/2604.26805
← 上一篇
jcode上GitHub Trending:一个Rust harness在内存这件事上专挑Claude Code的刺
下一篇 →
ClawGym:13500个验证任务、200条bench,终于有人把agent SFT pipeline做对了
← 返回所有文章

评论

加载中...
>_