撰文:Techub News 整理
在近期于华盛顿特区举行的 GTC 2025 大会上,NVIDIA 创始人兼 CEO Jensen Huang(黄仁勋)进行了长达近两小时的主题演讲。这场演讲不仅是年度最重要的 AI 与计算技术风向标,更因密集发布了涉及 AI 基础设施、6G 通信、量子计算、机器人等多个领域的重磅产品与合作而备受关注。黄仁勋系统性地阐述了 NVIDIA 如何通过“极端协同设计”应对后摩尔定律时代的算力挑战,并勾勒出以 AI 为核心驱动力的下一代工业蓝图。
加速计算的时代:从 CUDA 到 AI 工厂
演讲伊始,黄仁勋回顾了美国科技创新史,并指出我们正处在一个由革命性新计算模型开启的新时代。他强调,加速计算(Accelerated Computing)的拐点已经到来。这并非简单的硬件升级,而是一场持续了三十年的范式转移。NVIDIA 发明 GPU 和 CUDA 编程模型,正是为了解决通用 CPU 无法处理的问题。然而,加速计算需要全新的算法、库乃至重写应用程序,这是一个漫长而艰巨的过程。
黄仁勋将 CUDA-X 生态视为公司的“宝藏”。这超过 350 个库——从用于计算光刻的 cuLitho,到医疗影像 AI 框架 MONAI,再到驱动大语言模型的 Megatron Core——每一个都针对特定领域重新设计了算法,开启了新的市场。他展示了一段完全由模拟生成、毫无人工动画的视频,涵盖了从医疗到制造业、机器人、自动驾驶等各行各业,以此彰显数学与计算机科学的威力,以及加速计算已渗透至所有行业。
然而,AI 的崛起彻底重塑了计算堆栈。黄仁勋指出,过去的软件业是关于创造“工具”(如 Excel、浏览器),而AI 的本质是“工作者”,是能够使用这些工具完成工作的智能体。例如,NVIDIA 内部工程师广泛使用的 Cursor,就是一个能使用 VS Code 工具编写代码的 AI 伙伴。这种转变意味着,AI 将直接参与价值数万亿美元的全球经济生产,而不仅仅是服务于万亿规模的 IT 工具市场。
这催生了对新型计算系统的需求。黄仁勋提出了“AI 工厂”的概念。与传统数据中心运行多种应用、存储文件不同,AI 工厂是高度专业化的设施,其核心任务是高效、低成本地生产“智能令牌”(Tokens)。这些令牌可以是文本、图像、蛋白质结构或机器人动作指令。AI 工厂需要实时处理上下文、分解问题、推理并执行计划,每一步都需要生成海量令牌,这对算力提出了指数级增长的需求。
“人们过去常说推理很简单,训练才是难点,”黄仁勋说,“但思考怎么会是简单的? regurgitating 记忆内容是简单的,思考是困难的。”他阐述了 AI 发展的三个技术阶段:预训练(学习基础能力)、后训练(学习技能)以及“思考”(基于新知识的持续推理与交互)。后两者,尤其是“思考”,给计算基础设施带来了前所未有的压力。
更关键的是,AI 行业在去年迎来了转折点:模型已经足够智能,值得人们为之付费。从 Cursor、11 Labs 到 OpenAI、Claude,付费使用成为常态。这形成了一个双重指数增长的飞轮:模型越智能,使用越多;使用越多,所需算力越大;更多算力投入使得模型更智能。然而,在摩尔定律已近终结的背景下,如何满足这种指数需求?
黄仁勋的答案是:极端协同设计(Extreme Co-design)。NVIDIA 是当今唯一能从空白纸张开始,同步思考新计算机架构、芯片、系统、软件、模型架构和应用的公司。最新的 Grace Blackwell NVLink 72 系统正是这一理念的体现。它并非单个芯片的升级,而是将 72 个 GPU 通过 NVLink 互联成一个巨型虚拟 GPU,并针对未来 AI 模型(如混合专家模型 MoE)的特点进行优化。结果是,尽管晶体管数量仅翻倍,但其每 GPU 性能达到了上一代 H200 的 10 倍,同时实现了全球最低的令牌生成成本。
黄仁勋透露,NVIDIA 已经获得了价值5000 亿美元的 Blackwell 及早期 Rubin 订单可见性(不包括中国及亚洲部分地区),这相当于 Hopper 整个生命周期收入的五倍。他播放了一段视频,展示了从亚利桑那州的硅片到德克萨斯州组装完成的 Blackwell 超大规模系统的美国本土制造过程,并强调“我们正在美国再次制造”。
展望下一代,黄仁勋展示了代号为“Vera Rubin”的第三代 NVLink 72 机架级计算机。它采用全液冷、无电缆设计,并引入了新的“上下文处理器”(Context Processor),以应对 AI 需要处理越来越长上下文(如阅读大量 PDF、观看视频)的趋势。连接所有这些处理器的 NVLink 交换机的带宽,相当于全球互联网的峰值流量。
重塑通信、量子与产业生态
除了核心的 AI 计算,黄仁勋宣布了多个进军新领域的重磅计划。
6G 与通信:NVIDIA 推出了全新的产品线——NVIDIA ARC(Aerial Radio network Computer,空中无线网络计算机)。ARC 基于 Grace CPU、Blackwell GPU 和专为应用设计的 ConnectX 网络技术构建,运行名为 Aerial 的 CUDA-X 库。其核心是创造一个软件定义、可编程的计算机,能够同时进行无线通信和 AI 处理。NVIDIA 已与全球第二大电信设备商诺基亚达成合作,诺基亚将把 ARC 作为其未来基站的核心,并与现有 AirScale 基站兼容,这意味着全球数百万基站可通过软件升级获得 6G 和 AI 能力。黄仁勋指出,AI 将用于 RAN(无线接入网)以提高频谱效率,同时也能在 RAN 之上构建边缘工业机器人云,这类似于 AWS 在互联网之上构建云计算。
量子计算:NVIDIA 发布了 NVQ Link,一种直接将量子处理器(QPU)与 NVIDIA GPU 连接的新互联架构。量子纠错需要极高的数据吞吐量和极低的延迟,NVQ Link 正为此而生。同时,其开放平台 CUDA-Q 已扩展至支持 QPU,使 QPU 与 GPU 能够在微秒级延迟内协同工作。黄仁勋宣布,已有 17 家量子计算公司和 8 个美国能源部(DOE)下属国家实验室支持 NVQ Link。此外,DOE 正与 NVIDIA 合作建造7 台新的 AI 超级计算机,以推进美国科学前沿。
企业应用与网络安全:NVIDIA 正将其库和模型深度集成到企业软件生态中。黄仁勋宣布了与 CrowdStrike 的合作,旨在利用 AI 打造“光速”网络安全防御系统。同时,NVIDIA 也将与 Palantir 合作,加速其 Ontology 平台的数据处理能力,为政府和企业的海量结构化和非结构化数据提供实时洞察。
开源模型:黄仁勋强调开源模型对于研究人员、初创公司和各行各业至关重要,美国必须在开源领域保持领先。NVIDIA 目前是开源贡献的领导者,在多个排行榜上有 23 个领先模型,涵盖语言、物理 AI、机器人、生物学等领域。
物理 AI 与机器人:数字孪生驱动未来制造
黄仁勋将物理 AI(理解物理世界规律、因果关系的 AI)的实现归结为需要三台计算机:用于训练模型的 Grace Blackwell 超算;用于在数字孪生中模拟和训练机器人或工厂的 Omniverse 计算机(需具备强大的生成式 AI 和计算机图形能力);以及部署在机器人或自动驾驶汽车内部的机器人计算机 Jetson Thor。
他展示了与富士康合作,在 Omniverse 数字孪生中设计、模拟并优化其位于德克萨斯州的 AI 基础设施制造工厂。工厂内的机器人(如 FANUC 机械臂)在 Isaac Sim 中接受训练,AI 视觉代理监控整个流程。这体现了“工厂本身就是一个协调机器人来制造机器人产品的机器人”。
黄仁勋认为,人形机器人很可能成为未来最大的消费电子和工业设备市场之一。他提到了与 Figure、特斯拉(Elon Musk)、Agility Robotics 等公司的合作。特别引人注目的是与迪士尼研究院合作的“Blue”机器人项目,它在一个名为“Newton”的革命性物理仿真平台中学习。黄仁勋强调,观众所见的 Blue 的所有动作都是实时模拟,而非动画。
在更接近商业化的轮式机器人方面,NVIDIA 推出了 Nvidia Drive Hyperion 架构。这是一个“机器人出租车就绪”的标准平台,包含全套传感器(环视摄像头、雷达、激光雷达),旨在为 Lucid、梅赛德斯-奔驰、Stellantis 等汽车制造商以及 Aurora、Momenta、Nuro 等自动驾驶系统开发商提供基础。同时,NVIDIA 宣布与 Uber 合作,未来将把 Hyperion 车辆接入全球网络。
演讲最后,黄仁勋总结道,当前正同时经历两大平台转型:从通用计算到加速计算,以及从传统手工编码软件到人工智能。NVIDIA 通过 CUDA 和 CUDA-X 生态触及几乎所有行业,并已到达增长的拐点。量子计算、开源模型、企业应用、机器人、6G 通信和本土制造共同构成了 NVIDIA 引领下一波工业革命的蓝图。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。