2026年6月2日APIBenchmark

MAI-Thinking-1:万亿参数稀疏MoE,盲测全面领先Claude Sonnet 4.6

同一场Build大会上,微软还发布了MAI-Thinking-1。架构是稀疏MoE:总参数量约1万亿,但每次查询只激活350亿。这是在保持前沿性能的同时让推理成本可控的关键设计。

推理能力的数据:AIME 2025拿下97.0%,AIME 2026拿下94.5%。微软还做了1,276场盲测,人类评估者在头对头对比中选择MAI-Thinking-1优于Claude Sonnet 4.6。256k token上下文窗口,意味着它可以在单次请求里处理一整个大型代码仓库或者一份完整的长合同。

目前在Microsoft Foundry私测,公开预览会上线MAI Playground:https://playground.microsoft.ai/chat。微软同时推出两款模型——代码专用的MAI-Code-1-Flash和深度推理的MAI-Thinking-1。这背后的信号很清晰:微软不再满足于只做OpenAI的分销商。
← 上一篇
MAI-Code-1-Flash:微软自研代码模型,SWE-Bench打赢Claude Haiku 16分
下一篇 →
Nemotron 3 Ultra:英伟达5500亿参数开源模型,专门给Agent设计
← 返回所有文章

评论

加载中...
>_