2026年5月5日Research Skills Agents

Ctx2Skill 教 Skills 这波怎么自己造 skill

清华加 UIUC 在 arXiv 放了 Ctx2Skill。这篇切的是整个 Skills 浪潮里大家都绕过的那个问题。你可以塞给 agent 一个 markdown skill 没错，但 skill 一开始是谁写的？Ctx2Skill 给的答案是三 agent 自博弈。Challenger 出题，Reasoner 用一个边解题边长大的 skill 库去解，Judge 打分。skill 蒸馏成自然语言流程，跨时间 replay 防止系统只对最近任务过拟合。

在 CL-bench 的四个 context-learning benchmark 上，不管主模型是谁，求解率都稳定提升。这才是要紧的部分——skill 库是真的泛化，不是冻死的 prompt。

这是过去一个月那场 Skills 大爆发的学术回答。Anthropic Skills、mattpocock/skills、browserbase/skills、andrej-karpathy-skills、SkillClaw、Skills-Coach、EvoAgent，全都靠人手工写。Ctx2Skill 是第一篇通过结构化自博弈让 agent 自己长出 skill 库的论文。这条路要是能稳定 scale，agent 产品下一段护城河就不是"谁手里有 Anthropic 钦定的最好 skill pack"，而是"谁的 runtime 当场能造出对的 skill"。

论文：https://arxiv.org/abs/2604.27660。

← 上一篇

OpenClick 是个谁也没指望苹果会自己做的开源 macOS 点击 agent

GitHub 每日之星 — 2026年05月06日

← 返回所有文章

加载中...

Ctx2Skill 教 Skills 这波怎么自己造 skill

相关文章

评论