Stepfun把Agent用的Flash模型开源了
中国厂商Stepfun在5月28日扔出了Step 3.7 Flash——198B的MoE,每token激活11B左右,自带1.8B的ViT做视觉,256K上下文,三档可选的推理深度(高/中/低),真机400 tokens/秒。Apache 2.0。权重挂在Hugging Face,代码在GitHub,OpenRouter已经接入,英伟达官方技术博客已经发企业部署文章。
发布里最关键的词是FLASH。这不是Stepfun要去硬碰GPT-5.5的智商上限。这是专门设计给agent循环调用50次的那种模型——视觉进,tool call出,快到你可以放进循环里跑而不用心疼账单。官方明确把Claude Code、OpenClaw、Kilo Code列成首发部署目标。
发布时公布的数字:在ClawEval-1.1、SimpleVQA-with-Search、SWE-bench Pro上拿到开源模型的领先成绩。Benchmark数字按惯例打个折看,但形状很清楚——多模态进,agent循环出,会写代码,会搜索,开权重。
更大的画面是:agent模型里那个又便宜又快的那一档,已经不是OpenAI和Anthropic独占了。闭源API侧DeepSeek把成本这条赛道拿下了;现在Stepfun把同样的思路做成开源权重摆在桌上,而且从底层就是按agent实际在干什么设计的(看屏幕、调工具、写代码),不是按chatbot怎么聊天设计的。
模型:https://huggingface.co/stepfun-ai/Step-3.7-Flash
← 返回所有文章
发布里最关键的词是FLASH。这不是Stepfun要去硬碰GPT-5.5的智商上限。这是专门设计给agent循环调用50次的那种模型——视觉进,tool call出,快到你可以放进循环里跑而不用心疼账单。官方明确把Claude Code、OpenClaw、Kilo Code列成首发部署目标。
发布时公布的数字:在ClawEval-1.1、SimpleVQA-with-Search、SWE-bench Pro上拿到开源模型的领先成绩。Benchmark数字按惯例打个折看,但形状很清楚——多模态进,agent循环出,会写代码,会搜索,开权重。
更大的画面是:agent模型里那个又便宜又快的那一档,已经不是OpenAI和Anthropic独占了。闭源API侧DeepSeek把成本这条赛道拿下了;现在Stepfun把同样的思路做成开源权重摆在桌上,而且从底层就是按agent实际在干什么设计的(看屏幕、调工具、写代码),不是按chatbot怎么聊天设计的。
模型:https://huggingface.co/stepfun-ai/Step-3.7-Flash
评论