2026年3月27日ResearchOpen SourceAgents

OpenSeeker:完全なトレーニングデータを公開した初の完全オープンソース検索エージェント

OpenSeekerは、フロンティア検索ベンチマークで最先端の性能を達成しつつ、トレーニングパイプラインとデータを完全にオープンソース化した初の学術プロジェクトである。HuggingFace Daily Papersで104アップボートを獲得した。

わずか11.7KのトレーニングサンプルでチームはQwen3-30B-A3B-Thinkingをファインチューニングし、BrowseComp-ZHでTongyi DeepResearch(48.4% vs 46.7%)を含む商用システムを上回る結果を達成した。完全な合成パイプライン、高忠実度のトレーニングデータ、モデルの重みがオープンソース公開されている。

OpenSeekerは検索エージェント分野の重要なギャップに対処している。Perplexity、Google Deep Research、Tongyi DeepResearchなどの商用検索エージェントは強力な結果を出しているが、トレーニングデータと手法はプロプライエタリのままである。OpenSeekerは完全なレシピを提供することでこの能力を民主化する。

エージェントエコシステムにとって、検索は最も基本的なエージェント能力の一つであるため、これは重要な意味を持つ。完全なトレーニングパイプラインのオープンソース化により、どのチームもプロプライエタリデータなしで競争力のある検索エージェントを構築できるようになった。

GitHub: https://github.com/rui-ye/OpenSeeker
論文: https://arxiv.org/abs/2603.15594
← 前の記事
GLM-5-Turbo:AIエージェントワークフロー専用にゼロから構築された初のLLM
次の記事 →
Attention Residuals:Moonshot AIによるTransformerアーキテクチャのドロップインアップグレード
← すべての記事に戻る

Comments

Loading...
>_