2026年5月19日SkillsResearchAgents

SkillsVote 给 Agent 技能库装上投票闸门

arXiv 2605.18401,HuggingFace Daily Papers 111 个赞。Hongyi Liu 等人提出一个 agent 技能库的生命周期治理框架——收集、推荐、演化——给每次技能入库装上闸门,谁能进谁不能进有标准。结果:Terminal-Bench 2.0 涨 7.9 分,SWE-Bench Pro 涨 2.6 分。

"投票" 这个 framing 才是关键。过去半年我们看过好几个技能框架(Anthropic Skills、Imbad0202 学术研究技能、tech-leads-club agent-skills、scientific-agent-skills)。它们都在解决 "技能从哪里来" 的问题。没有一个真正解决 "agent 自己往库里塞技能时,怎么不让库被烂技能毒掉"。

SkillsVote 的答案:每一次技能更新都走 evidence-gated 审批——质量信号、环境依赖、底层代码源头画像。库不是 agent 要什么就给什么,是证据 vote 通过才进。轨迹变候选,候选过审才变技能。

这跟更大的技能安全簇是配套的——ClawHavoc 那次 341 个恶意 skill 事件、New Stack 那篇漏洞审计、OWASP Agentic Skills Top 10 draft、tech-leads-club 的签名 registry。Provenance 加内容寻址是第一步,证据驱动的演化是第二步。

论文: https://arxiv.org/abs/2605.18401
← 上一篇
ViMax 把视频生成做成一个剧组
下一篇 →
超级用户日报: 2026-05-20
← 返回所有文章

评论

加载中...
>_