Nemotron 3 Ultra:英伟达5500亿参数开源模型,专门给Agent设计
黄仁勋6月1日在台北Computex台上宣布了Nemotron 3 Ultra。5500亿参数,6月4日正式开源——Hugging Face、ModelScope、OpenRouter、build.nvidia.com都可以拿到。Nemotron 3系列分Nano、Super、Ultra三档,开发者按算力规模选型。Ultra这档专门面向长任务型agent:规划、工具调用、文件检查、持续代码生成、长任务链里的状态维护。
Artificial Analysis Intelligence Index上得了48分,是美国开源权重模型里的最高分,但跟中国的顶级开源模型相比还有差距。预发布在DeepInfra测的速度超过300 tokens每秒,对需要高速迭代的agent很重要。
英伟达的逻辑很直接:开源强大的agent模型,让更多开发者用它搭东西,最后还是要买英伟达的芯片跑推理。训练算力周期过了高峰之后,英伟达要靠推理基础设施保住份额。完整公告:https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models
← 返回所有文章
Artificial Analysis Intelligence Index上得了48分,是美国开源权重模型里的最高分,但跟中国的顶级开源模型相比还有差距。预发布在DeepInfra测的速度超过300 tokens每秒,对需要高速迭代的agent很重要。
英伟达的逻辑很直接:开源强大的agent模型,让更多开发者用它搭东西,最后还是要买英伟达的芯片跑推理。训练算力周期过了高峰之后,英伟达要靠推理基础设施保住份额。完整公告:https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models
评论