Mistral Medium 3.5 — Mistral 把 agent harness 一起发了
Mistral 又下场了。Medium 3.5 这次不只是放个新模型,是把 agent harness 一起打包发了。
128B 参数 dense 模型,256k 上下文,开放权重 modified MIT license。SWE-Bench Verified 跑出 77.6%,τ³-Telecom agentic benchmark 91.4。API 价格 $1.5/M input、$7.5/M output——比 Anthropic 旗舰便宜不少。
更关键的是和模型一起发的 Vibe Remote Agents。本质上把 Devin 那一套搬到 Mistral 这边:CLI 起一个 cloud session,agent 在 sandbox 里自己跑,关电脑也不影响。能挂 GitHub、Linear、Jira、Sentry、Slack、Teams,跑完自动开 PR 推通知。还有 session teleportation——本地写一半,传到云上让 agent 接着干。Cognition 周三发的 Devin Terminal 是同一套思路。
这事的判断点不在模型本身,在分发。Anthropic 有 Claude Code,OpenAI 有 Codex CLI,Cognition 有 Devin。Mistral 之前一直是欧洲主权云、客户自部署的那种定位,agent 客户端这一层是空的。这次直接补齐。开放权重模型加上自己的 agent harness 这个组合在欧洲监管语境下杀伤力很大——客户既要主权云能上手的模型,又要 agent 工作流,Mistral 一次给齐。这正好对上 EU AI Act 出来之后的采购约束。
给 foundation labs 提个醒:底下这层模型再强,没有 agent 客户端的拳头产品就被绕过去了。Warp 昨天开源 terminal,Cognition 周三发 Devin Terminal,今天 Mistral 上 Vibe——一周里第三家在 agent 客户端层下注。
链接:https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5
← 返回所有文章
128B 参数 dense 模型,256k 上下文,开放权重 modified MIT license。SWE-Bench Verified 跑出 77.6%,τ³-Telecom agentic benchmark 91.4。API 价格 $1.5/M input、$7.5/M output——比 Anthropic 旗舰便宜不少。
更关键的是和模型一起发的 Vibe Remote Agents。本质上把 Devin 那一套搬到 Mistral 这边:CLI 起一个 cloud session,agent 在 sandbox 里自己跑,关电脑也不影响。能挂 GitHub、Linear、Jira、Sentry、Slack、Teams,跑完自动开 PR 推通知。还有 session teleportation——本地写一半,传到云上让 agent 接着干。Cognition 周三发的 Devin Terminal 是同一套思路。
这事的判断点不在模型本身,在分发。Anthropic 有 Claude Code,OpenAI 有 Codex CLI,Cognition 有 Devin。Mistral 之前一直是欧洲主权云、客户自部署的那种定位,agent 客户端这一层是空的。这次直接补齐。开放权重模型加上自己的 agent harness 这个组合在欧洲监管语境下杀伤力很大——客户既要主权云能上手的模型,又要 agent 工作流,Mistral 一次给齐。这正好对上 EU AI Act 出来之后的采购约束。
给 foundation labs 提个醒:底下这层模型再强,没有 agent 客户端的拳头产品就被绕过去了。Warp 昨天开源 terminal,Cognition 周三发 Devin Terminal,今天 Mistral 上 Vibe——一周里第三家在 agent 客户端层下注。
链接:https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5
评论