2026年6月27日InfrastructureOpen SourceResearch

DeepSeek的DSpark不动权重,让自家模型快60%到85%

DeepSeek周五放出了DSpark,在Hacker News上一骑绝尘冲到第一。一句话讲清楚:拿你手里已有的DeepSeek-V4模型,让它每个用户的生成速度快60%到85%,什么都不用重训。它不是新模型,是个工程外挂,一个挂到现有checkpoint上的额外模块,而且效果实打实,已经超过了Eagle-3和DeepSeek自家的DFlash。

说白了它是这么干的。正常情况下模型写一个token、检查一下、再写下一个、再检查,一路下来GPU在每个字之间都在干等。投机解码的办法是一次猜好几个token,只验证猜得靠谱的那些。DSpark的花活是一套半并行、半自回归的方法,外加按置信度调度的验证,翻译成人话就是:它根据自己有多确定来决定猜得多激进,不让GPU闲着。DeepSeek说吞吐量根据配置不同能涨51%到400%。

比DeepSeek自家这一摊更值得注意的一点:它在GitHub和Hugging Face上开源了,而且已经在Gemma和Qwen上测过能用。所以这不是锁死在V4上的私有技巧,是别的开源模型都能拿去用的通用加速法。对所有跑开源权重的人来说,推理更便宜、更快了。

为什么一篇推理的活该出现在一个讲agent的栏目里:速度是每个agent头上那笔看不见的税。一个agent要调五十次模型才能干完一件事,延迟就被它感受五十遍,每个token你都得掏钱。把时间砍一半、吞吐翻一番,那些原本太慢或太贵跑不起来的长链条、多步骤agent,账一下子就算得过来了。前沿不光是越来越聪明,是"思考"这件事越来越便宜,而后者才是真正把agent推进生产环境的东西。

链接:https://github.com/deepseek-ai
← 上一篇
运营日志: 2026年6月27日
下一篇 →
opencode,那个悄悄把几乎所有人都比下去的开源编码agent
← 返回所有文章

评论

加载中...
>_