英伟达在投入260亿美元开放模型人工智能的背景下推出了Nemotron 3 Super——美国对Qwen的回应？

Nvidia刚刚发布了Nemotron 3 Super，这是一个具有1200亿参数的开源权重模型，旨在有效运行自主AI代理，而不会耗尽您的计算预算。

这并不是一个小问题。多代理系统产生的令牌数量远远超过普通聊天——每一次工具调用、推理步骤和上下文片段都需要重新发送。因此，成本激增，模型往往漂移，代理逐渐忘记它们原本应该做的事情……或者至少精确度降低。

Nemotron 3 Super是Nvidia对此的解答。该模型在1200亿总参数中运行120亿个活跃参数，使用混合专家（MoE）设计，使推理成本保持低廉，同时保持复杂工作流所需的推理深度。它具备100万令牌的上下文窗口，因此代理可以在崩溃之前保留整个代码库，或者近750,000个单词在内存中。

为了构建其模型，Nvidia结合了三个在同一架构中很少同时出现的组件：Mamba-2状态空间层——一种更快、更节省内存的替代方案，适合处理长令牌流——以及用于精确回忆的Transformer注意力层和一种新的“潜在MoE”设计，它在将令牌嵌入路由到专家之前压缩它们。这使得模型能够以相同的计算成本激活四倍的专家。

该模型还在NVFP4中本地预训练，这是Nvidia的4位浮点格式。实际上，这意味着系统从第一轮梯度更新开始就学会了在4位算术中准确操作，而不是在高精度下训练后再进行压缩，这往往会导致模型失去准确性。

就上下文而言，模型的精度是以位为单位衡量的。全精度，称为FP32，是黄金标准——但在大规模运行时，这也是极其昂贵的。开发者通常会降低精度，以节省计算，同时尝试保持有用的性能。

可以把它想象成将4K图像缩小到1080p：从表面上看，图片仍然看起来一样，只是细节较少。通常，从32位精度直接降低到4位会严重削弱模型的推理能力。Nemotron通过从一开始就学习以低精度运作，避免了这个问题，而不是在后期被压缩。

与其前身相比，Nemotron 3 Super提供了超过五倍的吞吐量。与外部竞争对手相比，在推理吞吐量上，它比OpenAI的GPT-OSS 120B快2.2倍，比阿里巴巴的Qwen3.5-122B快7.5倍。

我们进行了自己的快速测试。在故意模糊、措辞不当或基于错误信息的提示上，推理效果良好。模型在未被要求的情况下捕捉到了上下文中的小错误，干净地处理了数学和逻辑问题，并且在问题本身稍有偏差时并未崩溃。

完整的训练管道是公开的：Hugging Face上的权重，在训练过程中看到的10万亿个经过精挑细选的预训练令牌，40百万个后训练样本，以及跨21个环境配置的强化学习配方。Perplexity、Palantir、Cadence和西门子正在将该模型集成到他们的工作流程中。

260亿美元的赌注

该模型可能是更大战略的一部分。一份2025财务文件显示，Nvidia计划在未来五年内花费260亿美元构建开源权重AI模型。高管们也证实了这一点。

应用深度学习研究副总裁Bryan Catanzaro告诉《连线》，公司最近完成了一个5500亿参数模型的预训练。Nvidia于2023年11月发布了其首个Nemotron模型，但该文件明确表明这不再是一个附属项目。

考虑到Nvidia的芯片仍然是训练和运行前沿模型的默认基础设施，这项投资具有战略意义。针对其硬件调整的模型使客户即使在竞争对手努力使用其他硬件时也有内在的理由留在Nvidia。然而，这一举措背后还有更紧迫的压力：美国在开源AI竞赛中正在迅速失利。

根据OpenRouter和Andreessen Horowitz的研究，中国的开源模型在2024年底占全球开源模型使用率的比例从1.2%增长到2025年底的约30%。阿里巴巴的Qwen根据Runpod的说法，超越了Meta的Llama，成为最常用的自托管开源模型。包括Airbnb在内的美国公司已将其用于客户服务。全球的初创公司都依托于此。超越市场份额，这种采用方式产生的基础设施依赖性也很难逆转。

尽管像OpenAI、Anthropic和谷歌等美国巨头将其最佳模型锁定在API后面，但来自DeepSeek到阿里巴巴的中国实验室一直在涌入开源生态系统。Meta是唯一与Llama在开源领域竞争的主要美国参与者，但扎克伯格最近表示，该公司可能不再使未来模型完全开放。

“最佳专有模型”和“最佳开源模型”之间的差距过去是巨大的——这对美国是有利的。现在，这一差距非常小，并且开源的一方越来越偏向中国。

在这一切中，还有一个硬件威胁。预计新的DeepSeek模型很快就会发布，并且有传言称它完全是在华为制造的芯片上训练的——华为是一家受到制裁的中国公司。如果得到证实，那么这将使全球开发者，尤其是在中国的开发者，有充分的理由开始测试华为的硬件。中国的Ziphu AI已经在这样做。

这是Nvidia最需要防止的情况：中国产生的开源模型和中国芯片构建一个完全不需要Nvidia的生态系统。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

英伟达在投入260亿美元开放模型人工智能的背景下推出了Nemotron 3 Super——美国对Qwen的回应？

260亿美元的赌注

Decrypt的精选文章

目录

相关文章