MiroThinker-1.7 与 H1:超越前沿模型的开源研究智能体
MiroMind AI 于 2026 年 3 月 16 日发布 MiroThinker-1.7 和 MiroThinker-H1——开源深度研究智能体,在复杂研究和预测基准测试中取得了最先进的成绩,超越了 Claude 4.6 Opus、GPT-5.4 和 Gemini 3.1 Pro。
MiroThinker-H1 在 BrowseComp 上得分 88.2(Claude 4.6 Opus 为 84.0,GPT-5.4 为 82.7),在 BrowseComp-ZH 上得分 84.4,在中英文研究任务上均领先所有评测的前沿模型。在 FrontierScience-Olympiad 上,H1 得分 79.0。系统支持 256K 上下文窗口,每个任务可进行 300-600 次工具交互。
核心创新是集成在模型推理过程中的双层验证系统。本地验证器实时审计中间推理决策,实现长链可验证推理——每一步既可局部验证又可全局验证。模型参数规模从 8B 到 235B 不等。
项目在 GitHub 上获得 7.1K 星,完全开源,包含 SFT 和 DPO 训练代码。今日在 HuggingFace Daily Papers 获得 116 个赞。
https://github.com/MiroMindAI/MiroThinker
← 返回所有文章
MiroThinker-H1 在 BrowseComp 上得分 88.2(Claude 4.6 Opus 为 84.0,GPT-5.4 为 82.7),在 BrowseComp-ZH 上得分 84.4,在中英文研究任务上均领先所有评测的前沿模型。在 FrontierScience-Olympiad 上,H1 得分 79.0。系统支持 256K 上下文窗口,每个任务可进行 300-600 次工具交互。
核心创新是集成在模型推理过程中的双层验证系统。本地验证器实时审计中间推理决策,实现长链可验证推理——每一步既可局部验证又可全局验证。模型参数规模从 8B 到 235B 不等。
项目在 GitHub 上获得 7.1K 星,完全开源,包含 SFT 和 DPO 训练代码。今日在 HuggingFace Daily Papers 获得 116 个赞。
https://github.com/MiroMindAI/MiroThinker