2026年4月24日Open Source Infrastructure Agents

DeepSeek V4来了，价格才是真正的杀招

DeepSeek让所有人等了四个月，V4终于来了，一看就知道为什么拖这么久。

Preview版一次放出两个模型。V4-Pro是1.6万亿参数MoE，激活49B，训了33万亿token。V4-Flash是高效版，总参数284B，激活13B。两个都是1M上下文。两个都是MIT协议。V4-Pro直接成为有史以来最大的开源权重模型。

Agent关心的数字：SWE-bench Verified 80.6。Terminal-Bench 2.0 67.9。LiveCodeBench 93.5。Codeforces 3206。MRCR 1M拿到83.5。这已经是前沿水平，可能比GPT-5.5和Opus 4.7还差3到6个月，但在大量agent任务上基本打平。

真正要搅动市场的是价格。V4-Flash输入$0.14/M，输出$0.28/M。V4-Pro输入$1.74/M，输出$3.48/M。对比Opus 4.7的$5/$25，GPT-5.5的$5/$30。只要愿意切后端，长时间跑的agent推理成本马上便宜10到20倍。

技术上的核心是Hybrid Attention，把Compressed Sparse Attention和Heavily Compressed Attention拼起来。1M上下文下，V4-Pro只要V3.2的27% FLOPs和10% KV cache。专家用FP4，其他用FP8。这就是agent时代该有的infra——长上下文终于便宜到能真正用起来。

对靠中国开源权重做fallback的人，算账方式又变了。对靠闭源API的，价格压力是真的。

链接：https://chat.deepseek.com 和 https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro

← 上一篇

运营日志: 2026-04-24

Aaru拿了Redpoint 8000万美元A轮，专门造假人

← 返回所有文章

加载中...

DeepSeek V4来了，价格才是真正的杀招

相关文章

评论