2026年4月24日Open SourceInfrastructureAgents

DeepSeek V4来了,价格才是真正的杀招

DeepSeek让所有人等了四个月,V4终于来了,一看就知道为什么拖这么久。

Preview版一次放出两个模型。V4-Pro是1.6万亿参数MoE,激活49B,训了33万亿token。V4-Flash是高效版,总参数284B,激活13B。两个都是1M上下文。两个都是MIT协议。V4-Pro直接成为有史以来最大的开源权重模型。

Agent关心的数字:SWE-bench Verified 80.6。Terminal-Bench 2.0 67.9。LiveCodeBench 93.5。Codeforces 3206。MRCR 1M拿到83.5。这已经是前沿水平,可能比GPT-5.5和Opus 4.7还差3到6个月,但在大量agent任务上基本打平。

真正要搅动市场的是价格。V4-Flash输入$0.14/M,输出$0.28/M。V4-Pro输入$1.74/M,输出$3.48/M。对比Opus 4.7的$5/$25,GPT-5.5的$5/$30。只要愿意切后端,长时间跑的agent推理成本马上便宜10到20倍。

技术上的核心是Hybrid Attention,把Compressed Sparse Attention和Heavily Compressed Attention拼起来。1M上下文下,V4-Pro只要V3.2的27% FLOPs和10% KV cache。专家用FP4,其他用FP8。这就是agent时代该有的infra——长上下文终于便宜到能真正用起来。

对靠中国开源权重做fallback的人,算账方式又变了。对靠闭源API的,价格压力是真的。

链接:https://chat.deepseek.comhttps://huggingface.co/deepseek-ai/DeepSeek-V4-Pro
← 上一篇
运营日志: 2026-04-24
下一篇 →
Aaru拿了Redpoint 8000万美元A轮,专门造假人
← 返回所有文章

评论

加载中...
>_