英伟达发布了其迄今为止最好的开放人工智能模型——但仍落后于中国

詹森·黄（Jensen Huang）周日走上台北的Computex舞台，穿着皮夹克，揭幕了Nemotron 3 Ultra——英伟达（Nvidia）有史以来最大的开放AI模型，至少目前是美国制造的最智能开放权重模型。这很好，但还不足以击败中国。

该模型大约包含5500亿个总参数，但在任何给定时刻仅使用550亿个活跃参数，采用一种称为专家混合（mixture-of-experts）的设计。参数决定了AI模型的知识广度，通常参数越多，模型越强大。

要理解专家混合模型的工作原理，可以想象它像一家拥有数百位专家的医院：当患者入院时，只有相关的医生实际出现，而不是所有在职人员。这种方法使得模型的运行成本远低于其标称参数数量所暗示的成本，这也是为什么英伟达可以声称推理速度快5倍，成本比可比的开放权重替代品低30%。

独立评估机构人工智能分析（Artificial Analysis）与英伟达合作进行预发布评估，将Nemotron 3 Ultra在其智力指数中排名为48——这是一个综合基准，聚合了10个评估，涵盖推理、编码、一般知识和代理性能，得分基于一个规模，其中更高的分数意味着更聪明。

这使它成为美国开放权重模型中占据明显领先地位的模型。下一个最接近的美国选项是谷歌的Gemma 4 31B，排名39；Nemotron 3 Super，排名36；以及OpenAI的gpt-oss-120b，排名33。

它与前身之间的差距非常明显。Nemotron 3 Super于2026年3月发布，参数为1200亿，已经被认为是稳定的自主代理开放模型。Ultra在指数上跳升12分，在这个基准测试环境中，这是一个巨大的飞跃。

什么是Nemotron家族

英伟达的模型业务比大多数人想象的要久。首个Nemotron品牌模型于2023年11月发布，第三代模型于2025年12月宣布。

该家族有三种大小：Nano用于轻量级任务，Super用于中等企业应用，Ultra用于复杂推理工作负载。这三者共享相同的混合架构，结合了Mamba-2层、标准Transformer注意力和专家混合路由。

Mamba-2是一种标准注意力的替代方案，可以以极低的成本处理长序列——当你想要一个能够一次性保持百万个标记在内存中的模型时，这一点尤为重要。Nemotron 3 Ultra支持1百万个标记的上下文窗口，意味着一个代理理论上可以同时查看整个大型代码库或数百份研究文档。

Ultra模型还包括一种称为多标记预测（MTP）的技术，这使得模型能够一次预测多个未来标记，而不是逐个进行，从而加快生成速度。所有三种Nemotron 3模型均通过在多个互动环境中使用强化学习进行了后训练，教会它们规划和执行多步骤任务，而不仅仅是回答问题。

Ultra的权重是公开的，训练配方也正在发布。运行它需要超级计算机吗？基本上是的——一个5500亿参数的模型属于数据中心的范畴。但你可以通过英伟达的API或云服务提供商访问它，而不需要自己拥有硬件，这与任何人通过浏览器使用GPT或Claude的方式是相同的。

快速模型，较慢的脑力

速度是Nemotron 3 Ultra真正突出的地方。在一个预发布的 DeepInfra端点上，该模型每秒输出超过300个标记。而其智力类别中的中国模型——DeepSeek V4 Pro和Kimi K2.6——今天通过其商业API的速度为每秒50到100个标记。这一速度差距对于实际部署非常重要，尤其是对于执行长多步骤任务的自主代理，每一步的等待很快就会累积。

但纯粹的速度并不能决定智能竞赛。人工智能分析所发布的图表清楚地说明了实际情况。在纵轴——智力上，Nemotron 3 Ultra排名48，虽然很不错，但是中国的Kimi K2.6来自月之创意（Moonshot AI），排名54。指数上的六分差距代表了一个重要的差别：Kimi K2.6于2026年4月发布，目前在全球所有AI模型中，排名第四，无论是封闭还是开放，仅比Anthropic、谷歌和OpenAI的专有旗舰模型低三分，后者均排名57。

美国的开放权重现状并不新鲜。中国实验室一直在开放生态系统中涌现出强大的模型，而美国企业——OpenAI、Anthropic、谷歌——则将其最佳系统保留在API后面。正如 Decrypt在三月报道的那样，中国的开源模型从2024年底的全球开源模型使用量约1.2%，到2025年底跃升至约30%。英伟达是积极尝试扭转这一趋势的最大美国品牌，公开披露了一个五年计划，计划在开放权重AI开发上花费260亿美元。

Nemotron 3 Ultra是迄今为止这一投资的最明显成果。英伟达还宣布，他们已经在开发下一代Nemotron 4，合作伙伴是Nemotron联盟，一个包括Mistral AI和Perplexity在内的八个AI实验室组成的团体，英伟达于2026年3月成立以共同开发开放前沿模型，基于DGX Cloud基础设施。Nemotron 3 Ultra将于6月4日发货。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

英伟达发布了其迄今为止最好的开放人工智能模型——但仍落后于中国

什么是Nemotron家族

快速模型，较慢的脑力

Decrypt的精选文章

目录

相关文章