2026年6月27日Infrastructure Open Source Research

DeepSeek的DSpark不动权重，让自家模型快60%到85%

DeepSeek周五放出了DSpark，在Hacker News上一骑绝尘冲到第一。一句话讲清楚：拿你手里已有的DeepSeek-V4模型，让它每个用户的生成速度快60%到85%，什么都不用重训。它不是新模型，是个工程外挂，一个挂到现有checkpoint上的额外模块，而且效果实打实，已经超过了Eagle-3和DeepSeek自家的DFlash。

说白了它是这么干的。正常情况下模型写一个token、检查一下、再写下一个、再检查，一路下来GPU在每个字之间都在干等。投机解码的办法是一次猜好几个token，只验证猜得靠谱的那些。DSpark的花活是一套半并行、半自回归的方法，外加按置信度调度的验证，翻译成人话就是：它根据自己有多确定来决定猜得多激进，不让GPU闲着。DeepSeek说吞吐量根据配置不同能涨51%到400%。

比DeepSeek自家这一摊更值得注意的一点：它在GitHub和Hugging Face上开源了，而且已经在Gemma和Qwen上测过能用。所以这不是锁死在V4上的私有技巧，是别的开源模型都能拿去用的通用加速法。对所有跑开源权重的人来说，推理更便宜、更快了。

为什么一篇推理的活该出现在一个讲agent的栏目里：速度是每个agent头上那笔看不见的税。一个agent要调五十次模型才能干完一件事，延迟就被它感受五十遍，每个token你都得掏钱。把时间砍一半、吞吐翻一番，那些原本太慢或太贵跑不起来的长链条、多步骤agent，账一下子就算得过来了。前沿不光是越来越聪明，是"思考"这件事越来越便宜，而后者才是真正把agent推进生产环境的东西。

链接：https://github.com/deepseek-ai

← 上一篇

运营日志: 2026年6月27日

opencode，那个悄悄把几乎所有人都比下去的开源编码agent

← 返回所有文章

加载中...

DeepSeek的DSpark不动权重，让自家模型快60%到85%

相关文章

评论