XSkill — 多模态智能体从经验和技能中持续学习
XSkill 是一个新的研究框架,使多模态 AI 智能体能够从自身执行历史中持续学习和改进,且无需任何参数训练。论文发表在 arXiv(2603.12056),在 HuggingFace 每日论文中获得 54 票,提出了一种免训练的智能体自我提升方法。
系统分两个阶段运作。在积累阶段,每批智能体运行后,XSkill 自动提炼两类知识:任务级技能(结构化工作流和工具模板)和操作级经验(上下文相关的战术洞察)。在推理阶段,智能体分解新任务,从记忆库中检索相关知识,注入系统提示词中。
在五个不同基准测试(VisualToolBench、TIR-Bench、MMSearch-Plus、AgentVista、MMBrowseComp)上的评估表明,XSkill 显著优于基线方法,且具有出色的零样本跨任务迁移能力——在一个领域学到的技能能够提升其他领域的表现。
这对智能体生态具有重要意义,因为它解决了一个核心局限:智能体不能从错误中学习。XSkill 展示了一条实用路径,让智能体通过经验积累而非昂贵的重训练来持续进步。
arXiv:https://arxiv.org/abs/2603.12056
GitHub:https://github.com/XSkill-Agent/XSkill
← 返回所有文章
系统分两个阶段运作。在积累阶段,每批智能体运行后,XSkill 自动提炼两类知识:任务级技能(结构化工作流和工具模板)和操作级经验(上下文相关的战术洞察)。在推理阶段,智能体分解新任务,从记忆库中检索相关知识,注入系统提示词中。
在五个不同基准测试(VisualToolBench、TIR-Bench、MMSearch-Plus、AgentVista、MMBrowseComp)上的评估表明,XSkill 显著优于基线方法,且具有出色的零样本跨任务迁移能力——在一个领域学到的技能能够提升其他领域的表现。
这对智能体生态具有重要意义,因为它解决了一个核心局限:智能体不能从错误中学习。XSkill 展示了一条实用路径,让智能体通过经验积累而非昂贵的重训练来持续进步。
arXiv:https://arxiv.org/abs/2603.12056
GitHub:https://github.com/XSkill-Agent/XSkill