XSkill — マルチモーダルエージェントにおける経験とスキルからの継続学習
XSkillは、マルチモーダルAIエージェントがパラメータ訓練なしに自身の実行履歴から継続的に学習・改善できる新しい研究フレームワークです。arXiv(2603.12056)に公開され、HuggingFace Daily Papersで54アップボートを獲得。エージェントの自己改善へのトレーニングフリーアプローチを紹介しています。
システムは2つのフェーズで動作します。蓄積フェーズでは、エージェント実行の各バッチ後に、XSkillが2種類の知識を自動的に蒸留します:タスクレベルのスキル(構造化されたワークフローとツールテンプレート)とアクションレベルのエクスペリエンス(コンテキスト固有の戦術的インサイト)。推論フェーズでは、エージェントが新しいタスクを分解し、メモリバンクから関連知識を取得し、システムプロンプトに注入します。
5つの多様なベンチマーク(VisualToolBench、TIR-Bench、MMSearch-Plus、AgentVista、MMBrowseComp)で評価され、XSkillはベースラインに対して大幅な改善を達成し、強力なゼロショットクロスタスク転移性を示しました——あるドメインで学んだスキルが他のドメインのパフォーマンスを向上させます。
これはエージェンティックエコシステムにとって重要です。エージェントの重要な限界——自らの失敗から学ばないこと——に対処しているからです。XSkillは、高コストな再訓練ではなく経験の蓄積を通じて時間とともに改善するエージェントへの実用的な道筋を示しています。
arXiv:https://arxiv.org/abs/2603.12056
GitHub:https://github.com/XSkill-Agent/XSkill
← すべての記事に戻る
システムは2つのフェーズで動作します。蓄積フェーズでは、エージェント実行の各バッチ後に、XSkillが2種類の知識を自動的に蒸留します:タスクレベルのスキル(構造化されたワークフローとツールテンプレート)とアクションレベルのエクスペリエンス(コンテキスト固有の戦術的インサイト)。推論フェーズでは、エージェントが新しいタスクを分解し、メモリバンクから関連知識を取得し、システムプロンプトに注入します。
5つの多様なベンチマーク(VisualToolBench、TIR-Bench、MMSearch-Plus、AgentVista、MMBrowseComp)で評価され、XSkillはベースラインに対して大幅な改善を達成し、強力なゼロショットクロスタスク転移性を示しました——あるドメインで学んだスキルが他のドメインのパフォーマンスを向上させます。
これはエージェンティックエコシステムにとって重要です。エージェントの重要な限界——自らの失敗から学ばないこと——に対処しているからです。XSkillは、高コストな再訓練ではなく経験の蓄積を通じて時間とともに改善するエージェントへの実用的な道筋を示しています。
arXiv:https://arxiv.org/abs/2603.12056
GitHub:https://github.com/XSkill-Agent/XSkill
Comments