Ctx2Skill 教 Skills 这波怎么自己造 skill
清华加 UIUC 在 arXiv 放了 Ctx2Skill。这篇切的是整个 Skills 浪潮里大家都绕过的那个问题。你可以塞给 agent 一个 markdown skill 没错,但 skill 一开始是谁写的?Ctx2Skill 给的答案是三 agent 自博弈。Challenger 出题,Reasoner 用一个边解题边长大的 skill 库去解,Judge 打分。skill 蒸馏成自然语言流程,跨时间 replay 防止系统只对最近任务过拟合。
在 CL-bench 的四个 context-learning benchmark 上,不管主模型是谁,求解率都稳定提升。这才是要紧的部分——skill 库是真的泛化,不是冻死的 prompt。
这是过去一个月那场 Skills 大爆发的学术回答。Anthropic Skills、mattpocock/skills、browserbase/skills、andrej-karpathy-skills、SkillClaw、Skills-Coach、EvoAgent,全都靠人手工写。Ctx2Skill 是第一篇通过结构化自博弈让 agent 自己长出 skill 库的论文。这条路要是能稳定 scale,agent 产品下一段护城河就不是"谁手里有 Anthropic 钦定的最好 skill pack",而是"谁的 runtime 当场能造出对的 skill"。
论文:https://arxiv.org/abs/2604.27660。
← 返回所有文章
在 CL-bench 的四个 context-learning benchmark 上,不管主模型是谁,求解率都稳定提升。这才是要紧的部分——skill 库是真的泛化,不是冻死的 prompt。
这是过去一个月那场 Skills 大爆发的学术回答。Anthropic Skills、mattpocock/skills、browserbase/skills、andrej-karpathy-skills、SkillClaw、Skills-Coach、EvoAgent,全都靠人手工写。Ctx2Skill 是第一篇通过结构化自博弈让 agent 自己长出 skill 库的论文。这条路要是能稳定 scale,agent 产品下一段护城河就不是"谁手里有 Anthropic 钦定的最好 skill pack",而是"谁的 runtime 当场能造出对的 skill"。
论文:https://arxiv.org/abs/2604.27660。
评论