NVIDIA 创始人 Jensen Huang(黄仁勋):护城河、CUDA 与 AI 未来

CN
2 小時前

撰文:Techub News 整理

导语

近日,NVIDIA 创始人兼 CEO Jensen Huang(黄仁勋)接受了知名播客主持人 Dwarkesh Patel 的长篇深度访谈。在这场超过 100 分钟的对话中,黄仁勋罕见地以极其坦诚和深入的方式,回应了外界关于 NVIDIA 护城河、CUDA 生态价值、供应链瓶颈、竞争对手挑战以及地缘政治等尖锐问题。作为 AI 浪潮中最具影响力的领袖之一,黄仁勋此次系统性阐述其商业哲学与技术愿景,为理解 NVIDIA 的当下地位与未来战略提供了关键视角。

摘要

  • NVIDIA 的核心是将电子转化为有价值的“Token”,这一过程融合了艺术、工程与科学,难以被商品化。
  • CUDA 生态系统的丰富性、庞大的安装基数以及无处不在的云支持,构成了 NVIDIA 强大且持久的软件护城河。
  • NVIDIA 的商业模式是“做必须做之事,尽可能少做”,即专注于难以被替代的加速计算栈,而将其他环节交由庞大的合作伙伴生态完成。
  • 黄仁勋认为,AI 工具的使用将呈指数级增长,反而会推动软件公司(工具制造商)的价值飙升,而非导致其商品化。
  • 针对中国市场,黄仁勋强烈反对极端的出口管制,认为这将导致美国科技产业丧失市场、削弱生态,最终损害其长期领导地位。

NVIDIA 的护城河:从电子到价值“Token”的旅程

访谈伊始,主持人便抛出一个尖锐问题:随着 AI 发展,软件可能被商品化,那么本质上是一家“软件公司”的 NVIDIA(其设计文件交由台积电等制造)是否也会面临商品化风险?黄仁勋对此给出了否定的答案,并阐述了他对 NVIDIA 本质的思考模型。

“我们的输入是电子,输出是‘Token’。中间是 NVIDIA。”黄仁勋说,“我们的工作是尽一切必要之努力,以尽可能少的方式,实现这种转化,并使其具备惊人的能力。”他解释道,所谓“尽可能少”,是指将非核心环节交给合作伙伴,构建庞大的生态系统。NVIDIA 的合作伙伴网络覆盖了从上游供应链到下游计算机公司、应用开发者和模型制造商的全部五个 AI 层次。

然而,NVIDIA 必须亲自完成的那部分工作“极其困难”。黄仁勋将电子到 Token 的转化过程描述为“一段不可思议的旅程”,其价值在于“让一个 Token 比另一个 Token 更有价值”。这背后需要大量的艺术、工程、科学和发明。“我怀疑这会被商品化。”他总结道。

针对外界认为 NVIDIA 通过锁定稀缺组件(如先进制程逻辑芯片、HBM 内存、CoWoS 封装)来构建护城河的观点,黄仁勋承认这是优势之一,但强调其根本在于 NVIDIA 能够基于对未来的清晰愿景,推动整个供应链进行大规模投资。“我花了很多时间直接或间接地告知我们的供应链、合作伙伴和生态系统,我们面前的机会有多大。”通过 GTC 等活动,他将上下游产业聚集在一起,让各方亲眼见证 AI 的进展和需求,从而共同投资未来。这种基于下游巨大需求而拉动上游投资的能力,是其规模得以持续的关键。

应对供应链瓶颈:没有无法在2-3年内解决的瓶颈

当被问及 AI 算力年复一年的翻倍增长是否会受限于上游产能(如 EUV 光刻机数量)时,黄仁勋显得相当乐观。他认为,瞬时需求大于总供给对行业而言是“良好的状态”。一旦出现瓶颈,整个产业会迅速聚焦解决,例如过去两年对 CoWoS 封装产能的疯狂投入,现已大大缓解。

“没有一个瓶颈会持续超过两三年,一个都没有。”黄仁勋断言。他举例说明,NVIDIA 通过提前数年预判瓶颈、投资新技术(如硅光子学)、发明新工作流程和测试设备,并与合作伙伴(如台积电)紧密协作,来塑造和准备好供应链以支持未来规模。同时,NVIDIA 自身也在通过架构和算法创新,大幅提升计算效率(如 Hopper 到 Blackwell 提升 30-50 倍),从另一个维度缓解对纯粹制程产能的依赖。

真正让他担忧的瓶颈来自下游,尤其是能源政策。他指出,重建美国制造业、建设 AI 工厂、发展电动汽车和机器人产业,无一不需要大量能源,而能源基础设施的建设周期远长于芯片产能的扩张。

CUDA 生态 vs. 专用芯片:为何加速计算是更广阔的游戏

针对 Google TPU 等专用加速器的竞争,黄仁勋清晰地划定了战场。他强调,NVIDIA 构建的是“加速计算”平台,而非单纯的“张量处理单元”。加速计算的应用范围远超出 AI,涵盖分子动力学、量子色动力学、流体力学、粒子物理、数据处理等众多科学和工程领域。

“NVIDIA 重新发明了计算的方式,从通用计算转向加速计算。我们的市场覆盖范围远大于任何 TPU 或 ASIC 可能达到的范围。”黄仁勋表示,NVIDIA 是唯一能够加速各种应用的平台,拥有庞大的生态系统,任何运营商都可以购买和运行其系统,这使得 NVIDIA 能够进入每一个云服务商和各行各业。

对于“AI 主要是可预测的矩阵乘法,因此专用芯片更优”的观点,黄仁勋予以驳斥。他指出,矩阵乘法只是 AI 的一部分。发明新的注意力机制、混合架构(如 SSM)、融合扩散与自回归技术等,都需要一个可编程的通用架构。CUDA 的灵活性和可编程性正是 AI 算法得以快速创新的关键。“每年实现 10 倍或 100 倍飞跃的唯一方法,是每年从根本上改变算法及其计算方式。这正是 NVIDIA 的根本优势。”

CUDA 的终极价值:生态、安装基数与无处不在

即使大型云厂商有能力为自己的特定架构编写定制内核,CUDA 对 NVIDIA 而言是否仍不可或缺?黄仁勋从三个层面阐述了 CUDA 的终极价值。

首先,是生态系统的丰富性、可编程性和能力。CUDA 支持所有框架,拥有最成熟的工具链。当开发者遇到问题时,他们更希望问题出在自己的代码而非底层计算机上。NVIDIA 经过充分验证的系统提供了一个可靠的基础。

其次,是庞大的安装基数。NVIDIA 拥有数亿个 GPU 部署在全球各地,从云到边缘,从数据中心到机器人。开发者编写的软件或模型可以在最广泛的设备上运行,这极具价值。

最后,是无处不在的部署。NVIDIA 的硬件存在于每一个主要云服务商以及本地部署中。对于不确定未来将使用哪个云或部署模式的 AI 公司和开发者而言,选择 CUDA 意味着最大的灵活性和可移植性。

黄仁勋进一步指出,NVIDIA 拥有世界上最了解其架构的工程师团队,他们与 AI 实验室紧密合作,通过优化通常能为客户的堆栈带来额外的 2 倍性能提升。“NVIDIA 的计算堆栈拥有世界上无与伦比的每总拥有成本(TCO)性能。”他挑战竞争对手在 MLPerf 等公开基准测试中证明其成本优势,并认为从第一性原理出发,其他架构很难在 TCO 上胜出。

投资策略、云业务与定价哲学

回顾对 Anthropic、OpenAI 等明星 AI 公司的投资,黄仁勋承认早期错过了机会,原因是当时未能深刻理解这些前沿 AI 实验室需要供应商提供巨额资本投资,而风投无法满足这种规模。他表示,如今 NVIDIA 已准备好并乐意进行此类投资,以支持关键 AI 公司的发展。

当被问及 NVIDIA 为何不利用其巨额现金自己成为云服务商(Hyperscaler)时,黄仁勋再次重申了“做必须做之事,尽可能少做”的公司哲学。他认为,构建加速计算平台是无人能替代 NVIDIA 完成的核心任务,而云服务市场已有众多参与者。NVIDIA 的角色是支持像 CoreWeave 这样的“新云”生态伙伴,确保 AI 架构能够连接尽可能多的行业和国家,而不是亲自下场运营云业务。

在芯片短缺时期,NVIDIA 的分配策略也备受关注。黄仁勋否认存在基于“扶持新云”等非市场因素的优先分配。他强调,分配基于预测、采购订单(PO)的先后顺序以及客户数据中心的准备情况,目的是最大化自身工厂的吞吐量。他坚决否认 NVIDIA 会采用“价高者得”的拍卖模式。“我们从不那样做。这是一个糟糕的商业实践。”黄仁勋表示,设定价格并保持稳定,成为行业可依赖的基石,对 NVIDIA 而言更为重要。

中国市场的争议:反对极端出口管制

关于对华芯片出口管制,黄仁勋表达了鲜明且强烈的反对立场。他认为,将中国视为必须完全切断技术的极端对手是幼稚且有害的。

黄仁勋指出,中国拥有世界 60% 的成熟制程芯片产能、大量能源、全球约 50% 的 AI 研究人员,并且是开源软件和开源模型的最大贡献者之一。当前,中国的 AI 生态系统主要构建在 NVIDIA 的美国技术栈之上。如果采取极端政策,迫使中国发展完全独立的技术栈,将导致美国拱手让出全球第二大市场,促使中国生态系统聚焦于其内部架构,最终可能形成一个与美国技术栈并行甚至竞争的标准体系。

“这对美国科技行业、国家安全和技术领导力都是一种损害,仅仅是为了(想象中的)一家公司的利益,这毫无道理。”黄仁勋认为,更明智的做法是保持对话和研究交流,确保全球 AI 开发者(包括中国开发者)继续在美国技术栈上进行开发,并使 AI 进步(尤其是开源部分)惠及美国生态。他警告,在半导体领域采取类似过去在电信领域的极端政策,已导致美国失去了对自身电信网络的控制权。

未来展望:架构创新与加速计算的本质

在访谈的最后,黄仁勋展望了未来。即使 AI 革命未曾发生,他相信 NVIDIA 依然会凭借“加速计算”的核心理念取得成功。他认为,通用计算(CPU)的扩展已接近极限,而通过 GPU 和 CUDA 对特定领域工作负载进行加速,是突破科学和工程领域瓶颈的关键。从计算机图形学到物理模拟、数据处理,都是加速计算的用武之地。

他透露,NVIDIA 正在根据市场需求扩展其产品边界,例如收购 Groq 并将其融入 CUDA 生态,以提供超低延迟的推理选项,满足对“高端 Token”的需求,实现推理市场的进一步细分。

当被问及是否会像其他公司那样探索完全不同的芯片架构(如晶圆级芯片、大型封装)时,黄仁勋表示,NVIDIA 有能力这样做,但模拟结果表明那些架构“可证明地更差”。“如果我们有更多的钱,我会把它更多地投在 NVIDIA 的架构后面。”他总结道,自信源于对自身技术路径的深刻理解和持续验证。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接