2026年4月30日Open Source Agents Framework

IBM Granite 4.1 — 8B 打 32B

IBM 4 月 30 日扔出 Granite 4.1，三个尺寸（3B、8B、30B），全部 Apache 2.0。标题不是模型数量，而是比例：新的 8B Instruct 在 tool calling 和 instruction following 上稳定追平甚至打过上一代 Granite 4.0 的 32B Mixture-of-Experts。同一个架构家族，推理算力少了四倍。要么之前的 MoE 在掩盖训练弱，要么新的 post-training pipeline 才是真正的故事。

IBM 这次也把不性感但很有用的活儿干了——开箱支持 12 种语言，15 万亿 token 训练，post-training 栈直接对准 Agent 工作负载。工具调用、指令跟随、结构化输出。这不是个聊天玩具，是周一早上就能塞进 Agent harness 的东西。

背景很关键。10B 以下、tool use 真能用的开源权重，几乎是每个企业 Agent 项目卡住的瓶颈。前沿 API 太贵不能瞎调，70B+ 开源跑起来太慢部署不划算，现有 10B 以下基本撑不住多工具规划。Granite 4.1-8B 一张 H100 都装得下还有富余，据说能 handle 之前要 Llama-70B 级别才搞得定的工具链。

更大的故事是 IBM 已经悄悄变成了最稳定的开源模型出货方之一——不炫，但 Granite 1、3、4、4.1 一脉相承都有真本事，Apache 2.0 许可意味着大厂部署不用等法务。https://research.ibm.com/blog/granite-4-1-ai-foundation-models

← 上一篇

Stripe Link 让 AI Agent 替你刷卡

Legora 估值 56 亿 Nvidia 杀进法律 AI 战场

← 返回所有文章

加载中...

IBM Granite 4.1 — 8B 打 32B

相关文章

评论