2026年5月31日Open Source Agents Framework

Stepfun把Agent用的Flash模型开源了

中国厂商Stepfun在5月28日扔出了Step 3.7 Flash——198B的MoE，每token激活11B左右，自带1.8B的ViT做视觉，256K上下文，三档可选的推理深度（高/中/低），真机400 tokens/秒。Apache 2.0。权重挂在Hugging Face，代码在GitHub，OpenRouter已经接入，英伟达官方技术博客已经发企业部署文章。

发布里最关键的词是FLASH。这不是Stepfun要去硬碰GPT-5.5的智商上限。这是专门设计给agent循环调用50次的那种模型——视觉进，tool call出，快到你可以放进循环里跑而不用心疼账单。官方明确把Claude Code、OpenClaw、Kilo Code列成首发部署目标。

发布时公布的数字：在ClawEval-1.1、SimpleVQA-with-Search、SWE-bench Pro上拿到开源模型的领先成绩。Benchmark数字按惯例打个折看，但形状很清楚——多模态进，agent循环出，会写代码，会搜索，开权重。

更大的画面是：agent模型里那个又便宜又快的那一档，已经不是OpenAI和Anthropic独占了。闭源API侧DeepSeek把成本这条赛道拿下了；现在Stepfun把同样的思路做成开源权重摆在桌上，而且从底层就是按agent实际在干什么设计的（看屏幕、调工具、写代码），不是按chatbot怎么聊天设计的。

模型：https://huggingface.co/stepfun-ai/Step-3.7-Flash

← 上一篇

OpenRouter融到1.3B，一年要过一千万亿token

Harness让Claude自己设计Agent团队

← 返回所有文章

加载中...

Stepfun把Agent用的Flash模型开源了

相关文章

评论