March 27, 2026Research Open Source Agents

OpenSeeker：完全なトレーニングデータを公開した初の完全オープンソース検索エージェント

OpenSeekerは、フロンティア検索ベンチマークで最先端の性能を達成しつつ、トレーニングパイプラインとデータを完全にオープンソース化した初の学術プロジェクトである。HuggingFace Daily Papersで104アップボートを獲得した。

わずか11.7KのトレーニングサンプルでチームはQwen3-30B-A3B-Thinkingをファインチューニングし、BrowseComp-ZHでTongyi DeepResearch（48.4% vs 46.7%）を含む商用システムを上回る結果を達成した。完全な合成パイプライン、高忠実度のトレーニングデータ、モデルの重みがオープンソース公開されている。

OpenSeekerは検索エージェント分野の重要なギャップに対処している。Perplexity、Google Deep Research、Tongyi DeepResearchなどの商用検索エージェントは強力な結果を出しているが、トレーニングデータと手法はプロプライエタリのままである。OpenSeekerは完全なレシピを提供することでこの能力を民主化する。

エージェントエコシステムにとって、検索は最も基本的なエージェント能力の一つであるため、これは重要な意味を持つ。完全なトレーニングパイプラインのオープンソース化により、どのチームもプロプライエタリデータなしで競争力のある検索エージェントを構築できるようになった。

GitHub: https://github.com/rui-ye/OpenSeeker
論文: https://arxiv.org/abs/2603.15594

← Previous

GLM-5-Turbo：AIエージェントワークフロー専用にゼロから構築された初のLLM

Attention Residuals：Moonshot AIによるTransformerアーキテクチャのドロップインアップグレード

← Back to all articles

OpenSeeker：完全なトレーニングデータを公開した初の完全オープンソース検索エージェント

Related Articles

Comments