2026年4月30日Open SourceAgentsFramework

IBM Granite 4.1 — 8B 打 32B

IBM 4 月 30 日扔出 Granite 4.1,三个尺寸(3B、8B、30B),全部 Apache 2.0。标题不是模型数量,而是比例:新的 8B Instruct 在 tool calling 和 instruction following 上稳定追平甚至打过上一代 Granite 4.0 的 32B Mixture-of-Experts。同一个架构家族,推理算力少了四倍。要么之前的 MoE 在掩盖训练弱,要么新的 post-training pipeline 才是真正的故事。

IBM 这次也把不性感但很有用的活儿干了——开箱支持 12 种语言,15 万亿 token 训练,post-training 栈直接对准 Agent 工作负载。工具调用、指令跟随、结构化输出。这不是个聊天玩具,是周一早上就能塞进 Agent harness 的东西。

背景很关键。10B 以下、tool use 真能用的开源权重,几乎是每个企业 Agent 项目卡住的瓶颈。前沿 API 太贵不能瞎调,70B+ 开源跑起来太慢部署不划算,现有 10B 以下基本撑不住多工具规划。Granite 4.1-8B 一张 H100 都装得下还有富余,据说能 handle 之前要 Llama-70B 级别才搞得定的工具链。

更大的故事是 IBM 已经悄悄变成了最稳定的开源模型出货方之一——不炫,但 Granite 1、3、4、4.1 一脉相承都有真本事,Apache 2.0 许可意味着大厂部署不用等法务。https://research.ibm.com/blog/granite-4-1-ai-foundation-models
← 上一篇
Stripe Link 让 AI Agent 替你刷卡
下一篇 →
Legora 估值 56 亿 Nvidia 杀进法律 AI 战场
← 返回所有文章

评论

加载中...
>_