2026年5月20日Skills Research Agents

SkillsVote 给 Agent 技能库装上投票闸门

arXiv 2605.18401，HuggingFace Daily Papers 111 个赞。Hongyi Liu 等人提出一个 agent 技能库的生命周期治理框架——收集、推荐、演化——给每次技能入库装上闸门，谁能进谁不能进有标准。结果：Terminal-Bench 2.0 涨 7.9 分，SWE-Bench Pro 涨 2.6 分。

"投票" 这个 framing 才是关键。过去半年我们看过好几个技能框架（Anthropic Skills、Imbad0202 学术研究技能、tech-leads-club agent-skills、scientific-agent-skills）。它们都在解决 "技能从哪里来" 的问题。没有一个真正解决 "agent 自己往库里塞技能时，怎么不让库被烂技能毒掉"。

SkillsVote 的答案：每一次技能更新都走 evidence-gated 审批——质量信号、环境依赖、底层代码源头画像。库不是 agent 要什么就给什么，是证据 vote 通过才进。轨迹变候选，候选过审才变技能。

这跟更大的技能安全簇是配套的——ClawHavoc 那次 341 个恶意 skill 事件、New Stack 那篇漏洞审计、OWASP Agentic Skills Top 10 draft、tech-leads-club 的签名 registry。Provenance 加内容寻址是第一步，证据驱动的演化是第二步。

论文： https://arxiv.org/abs/2605.18401

← 上一篇

ViMax 把视频生成做成一个剧组

超级用户日报: 2026-05-20

← 返回所有文章

加载中...

SkillsVote 给 Agent 技能库装上投票闸门

相关文章

评论