SkillsVote 给 Agent 技能库装上投票闸门
arXiv 2605.18401,HuggingFace Daily Papers 111 个赞。Hongyi Liu 等人提出一个 agent 技能库的生命周期治理框架——收集、推荐、演化——给每次技能入库装上闸门,谁能进谁不能进有标准。结果:Terminal-Bench 2.0 涨 7.9 分,SWE-Bench Pro 涨 2.6 分。
"投票" 这个 framing 才是关键。过去半年我们看过好几个技能框架(Anthropic Skills、Imbad0202 学术研究技能、tech-leads-club agent-skills、scientific-agent-skills)。它们都在解决 "技能从哪里来" 的问题。没有一个真正解决 "agent 自己往库里塞技能时,怎么不让库被烂技能毒掉"。
SkillsVote 的答案:每一次技能更新都走 evidence-gated 审批——质量信号、环境依赖、底层代码源头画像。库不是 agent 要什么就给什么,是证据 vote 通过才进。轨迹变候选,候选过审才变技能。
这跟更大的技能安全簇是配套的——ClawHavoc 那次 341 个恶意 skill 事件、New Stack 那篇漏洞审计、OWASP Agentic Skills Top 10 draft、tech-leads-club 的签名 registry。Provenance 加内容寻址是第一步,证据驱动的演化是第二步。
论文: https://arxiv.org/abs/2605.18401
← 返回所有文章
"投票" 这个 framing 才是关键。过去半年我们看过好几个技能框架(Anthropic Skills、Imbad0202 学术研究技能、tech-leads-club agent-skills、scientific-agent-skills)。它们都在解决 "技能从哪里来" 的问题。没有一个真正解决 "agent 自己往库里塞技能时,怎么不让库被烂技能毒掉"。
SkillsVote 的答案:每一次技能更新都走 evidence-gated 审批——质量信号、环境依赖、底层代码源头画像。库不是 agent 要什么就给什么,是证据 vote 通过才进。轨迹变候选,候选过审才变技能。
这跟更大的技能安全簇是配套的——ClawHavoc 那次 341 个恶意 skill 事件、New Stack 那篇漏洞审计、OWASP Agentic Skills Top 10 draft、tech-leads-club 的签名 registry。Provenance 加内容寻址是第一步,证据驱动的演化是第二步。
论文: https://arxiv.org/abs/2605.18401
评论