2026年4月30日Agents Research Framework

快手扁鹊：跑在线上的agentic运维，告警量降75%

快手今天发了扁鹊，一个一直在他们电商搜索引擎上做运维的agentic框架。数字不是沙盒里的：告警量降75%，根因分析准确率80%，MTTR降一半以上。作者包括Bochao Liu、Chenyi Lei、Xiao Liang，还有十个快手搜索团队的人。

框架对问题的framing才是值得抬出来的部分。运维大型线上系统的瓶颈不在推理。瓶颈在编排：对任何一个告警，agent应该看哪一片遥测数据、哪些历史事件相关、应该用哪个runbook。扁鹊的答案是Flexible Skill Arrangement——skill声明它在哪个业务场景下需要什么数据和知识，框架在运行时把对的上下文wire到对的skill上，而不是把所有东西一股脑灌到prompt里。

这是那种六个月前发不出来的论文，因为没人有这种规模的生产agent运维可以写。上一波是检索增强的事件chat。扁鹊更接近一个真的SRE——它做诊断、它跑流程、它缩告警队列。告警降75%不是能编出来的那种数。

生产结果就是编辑点。大多数agent论文报benchmark。扁鹊报的是中国最大的视频和电商平台之一上的部署系统。2026年任何在做agentic运维的人，下一版上线之前都该读一下skill arrangement那一节。代码：https://github.com/benchen4395/BianQue_Assistant 论文：https://arxiv.org/abs/2604.26805

← 上一篇

jcode上GitHub Trending：一个Rust harness在内存这件事上专挑Claude Code的刺

ClawGym：13500个验证任务、200条bench，终于有人把agent SFT pipeline做对了

← 返回所有文章

加载中...

快手扁鹊：跑在线上的agentic运维，告警量降75%

相关文章

评论