黄仁勋 2026 GTC Taipei 演讲:AI 代理人时代来临,计算就是收入

CN
1小时前
「计算就是收入,计算就是利润。没有收入和利润,就是损失」

整理 & 编译:深潮TechFlow

嘉宾:黄仁勋,英伟达 CEO

播客源:邦妮區塊鏈 Bonnie Blockchain

原标题:黄仁勋 2026 GTC Taipei 演讲7大核心要点,辉达最新布局懒人包!【邦妮区块链】

播出日期:2026年6月2日

要点总结

在 2026 年 GTC Taipei 演讲中,黄仁勋把英伟达的下一阶段战略集中到一个核心判断:AI 已从生成内容进入能够工作的代理人时代,Token 不再只是技术指标,而是收入、利润和 GDP 的生产单元。围绕这一变化,英伟达推出 Vera Rubin、Vera CPU、企业级代理人工具包、与 Microsoft 合作的新一代 PC,以及面向物理 AI 的 Cosmos 3、Alpamayo 2 和 Isaac GR00T。黄仁勋强调,未来十年的计算模式将由模型、代理人框架、工具技能和运行时共同构成,并会从云、企业、本地 PC 扩散到机器人、工厂、卫星和边缘设备。对台湾供应链而言,这意味着 AI 工厂、功耗效率、基础设施交付速度和全栈协同能力,将成为下一轮产业增长的关键。

精彩观点摘要

AI 代理人时代的到来

  • "有用的 AI 已经到来,AI 现在是利润生成器,也是 GDP 生成器。它背后不只是大语言模型,而是一种全新的计算模式:代理人。"
  • "代理人由大语言模型和代理人框架组成,框架像操作系统一样连接记忆、工具、推理、规划和行动。"
  • "代理人系统的突破,来自大语言模型已经能够思考、推理、规划和使用工具,也来自代理人框架能够管理记忆、协调流程并调度工具。"
  • "每家公司都会成为代理人公司,每家公司内部都会运行代理人,也都会需要自己的代理人操作系统。"

Token、AI 工厂与基础设施经济学

  • "Token 现在是有利润的收入单位。AI 公司想生产更多 Token,就会建设更多 AI 工厂,这正是台湾计算需求暴涨的原因。"
  • "计算就是收入,计算就是利润。没有收入和利润,就是损失。"
  • "如果一座 AI 工厂只有 1 吉瓦电力,电力上限就是 1 吉瓦;在这个前提下,每瓦吞吐量就是收入,因为每一个 Token 都有价值。"
  • "只因为芯片更便宜就选择错误架构,并不会转化成真正收益,你需要确保的是每瓦收入。买得越多,赚得越多。"

Vera Rubin 与英伟达的基础设施转型

  • "Vera Rubin 不是一颗芯片,也不只是 GPU,而是一个从端到端构建的完整系统。"
  • "英伟达过去是 GPU 公司,后来成为系统公司,现在正在进一步变成基础设施公司,帮助客户建设 AI 工厂。"
  • "Vera Rubin 是英伟达历史上最有野心的工程,全公司 4 万名工程师都参与其中,台湾供应链也共同参与了这个系统的创造。"
  • "Grace Blackwell 是为处理 AI,尤其是推理而生;Vera Rubin 则是为运行代理人而生。"

Vera CPU 与代理人的计算需求

  • "过去所有 CPU 都是为人类打造的,这颗 CPU 是为代理人打造的。"
  • "代理人没有耐心。它们生活的世界不是以秒为单位,而是以纳秒为单位。代理人使用工具时,希望响应越快越好;访问数据库时,希望结果立刻返回。"
  • "Vera CPU 是为代理人打造的 CPU,它强调单线程性能、每时钟指令数、每核心带宽和系统总带宽。"
  • "这个市场一定会比上一个市场更大,因为代理人的数量会远远超过人类,而且代理人非常没有耐心。这就是 NVIDIA Vera CPU。"

下一代个人电脑

  • "未来的代理人计算模式会运行在 AI 云、企业内部,也会运行在你的 PC 上。"
  • "新的操作系统将是传统操作系统加上大语言模型;大语言模型在很多意义上就是现代版 DirectX,是计算机的智能扩展。"
  • "应用程序会被代理人运行时取代,现代应用将成为一个代理人。"
  • "英伟达与 Microsoft 正在重新发明 PC,并推出覆盖桌面、笔记本和工作站的新一代 Windows 机器。"

物理 AI、自动驾驶与机器人

  • "语言模型训练的是人类视角的数据,但机器人需要从机器人自身视角理解世界,物理 AI 最大的问题是数据。"
  • "Cosmos 3 是物理 AI 的前沿基础模型,可以理解、推理、生成、闭环仿真,甚至成为策略本身。"
  • "有了 AI 之后,计算本身也会变成数据;可以用 Cosmos 3 训练更多 AI 模型,并把它增强为自己的专有模型。"
  • "无论是云端代理人、PC 代理人、自动驾驶系统还是人形机器人,背后的计算模式都是一样的:模型、框架、工具技能和运行时。"

黄仁勋钦点台湾小吃成 AI 供应链

黄仁勋

台湾生态系统发展到今天的规模,真的令人难以置信。大多数人谈到生态系统时,首先想到的是我们的软件栈,想到英伟达计算系统之上的开发者生态。但英伟达的生态并不止于此,它一路向上延伸到台湾供应链,也就是一切开始的地方;再一路向下延伸到数据中心,最终到达终端用户。

今天,我们几乎会谈到这个生态系统的每一个环节。这里有太多人值得感谢。我热爱这里的生态系统,这里有非常多企业,也有许多我最喜欢的生态伙伴。台湾拥有极其丰富的生态系统,这是全球最好的供应链生态系统。

AI 代理人时代来临

黄仁勋

两年前我来到这里时,开始和大家谈 AI 如何从生成式 AI 走向下一波浪潮,下一波 AI 是代理式 AI。今天我们可以说,代理式 AI 已经到来,有用的 AI 已经到来。

从产业角度看,这意味着 Token 的需求正在变得极其旺盛。因为如果 AI 能真正做事,人们就会想生产更多这样的能力。Token 现在已经是有利润的单位,是能够产生收入的单位。既然它能赚钱,AI 公司就会想构建更多 Token、生成更多 Token、建设更多 AI 工厂,这也是台湾计算需求暴涨的原因。

这正是大家如此忙碌、业务表现如此好的原因。事实上,它看起来也反映在你们一些公司的股价上。计算模式已经改变,一切都变了。

第一个重点是:有用的 AI 已经到来,AI 现在是利润生成器,也是 GDP 生成器。在它背后,是一种全新的计算模式。它不只是大语言模型,而是代理人。今天我们几乎所有内容,都会建立在这个基础之上。

让我花一点时间说明我在说什么。这里面是一个代理人,一个代理人应用。过去,这里会是应用程序,是代码,是操作系统,也就是应用程序里的代码运行在操作系统之上。今天,它是代理人,由一个或多个大语言模型组成,并被放在一个代理人框架里。这个框架会帮助它协调工作,让它真正完成有生产力的任务。

当输入进入系统时,代理人必须理解、观察、推理、行动,并使用工具。工具可以是电子表格、网页浏览器、数据处理引擎,也可以是数据库引擎。每一次信息流转,无论是处理上下文、理解正在发生什么、推理下一步该做什么,还是形成可以执行的计划,都需要由某种软件来协调。

所以,代理人的本质就是这样一个系统。它处理短期记忆,也就是工作记忆,也处理长期记忆,就像人类一样。记忆管理系统因此变得极其重要。整个系统就叫做代理人。大语言模型负责思考,代理人框架把所有东西连接起来,就像操作系统一样。

这就是新的计算模式,也是代理人能够完成惊人任务的原因。这是一个重大突破:大语言模型已经能很好地思考、推理、规划、使用工具;与此同时,我们也拥有了能管理记忆、协调流程、调用工具的代理人框架。因此,我们现在可以做很多过去做不到的事。

AI 工厂的 Token 是什么?

黄仁勋

Token、DSX、GPU、CPU、Vera……我们已经打造了下一代系统 Vera Rubin。Vera Rubin 不是一颗芯片,也不只是 GPU。它从 GPU 开始,但远不止于 GPU。整个端到端系统,才是 Vera Rubin。

它包含 GPU、Vera Rubin NVLink 72,并由我稍后会介绍的 Vera CPU 协调。它也包括革命性的 Vera 存储系统、CX9、我们的软件栈 DOCA,以及内置的安全处理器。系统中的所有数据,无论是静态存储、传输过程中,还是正在被使用时,都会被加密。整个系统都是安全的,因为 AI 模型极其珍贵。这也是为什么整套系统都遵循机密计算。

这些系统里的任何一个,单独拿出来都足以成为一次完整革命。Vera Rubin 是英伟达历史上最有野心的工程。全公司 4 万名工程师都参与了 Vera Rubin 的工作,更不用说在座各位也参与了整个系统的创造。Vera Rubin 真的是一个奇迹,它不只是一颗芯片,而是许多组件共同构成的系统。

甚至还不止于此。很久以前,英伟达是一家 GPU 公司;这些年,我们逐渐演进成一家系统公司。你们现在看到的,是我们从零开始设计过的最复杂系统。可到最后,我们的客户和伙伴并不是想买计算机,他们想建设 AI 工厂。

这就是英伟达再次开始转型的原因。大家可以看到,我们的很多技术已经扩展到完整基础设施尺度。我们的伙伴也处在基础设施尺度上:发电厂、冷却系统、电网供应商,以及许多工业企业,现在都成为我们生态的一部分。归根结底,我们要构建完整技术栈,就像当初构建 GPU、Grace Blackwell、NVLink 72 一样;现在,我们要构建全栈系统,让客户能够建设出卓越的 AI 基础设施。

做好这件事,帮助客户建设和部署 AI 工厂,变得极其重要。原因很简单:计算就是收入,计算就是利润。没有收入和利润,就是损失。

大家需要理解一件事:当一套 AI 基础设施上线时,它可以很快上线,也可能拖很久;吞吐量可以很高,也可以很低;弹性和可靠性可以好,也可以差;有效使用寿命可以很长,也可以很短。因为这代表 500 亿、600 亿,甚至 1000 亿美元级别的投入,所以这条曲线极其重要。

这也是为什么英伟达是很好的合作伙伴。我们具备完整集成能力,不只是做了一页演示文稿,而是真正创造了整个基础设施,把一切连接起来,并且自己大规模建设,确保系统能够良好运行。因此,我们的首个 Token 时间、首个推理时间、训练启动时间都更快。

第二,我们的每瓦吞吐量、每瓦 Token 数是世界级的。原因在于我们集成所有东西,从零开始设计所有东西,模拟整个系统,并采用极致协同设计。就像刚刚展示的 Vera Rubin 机柜,一切设计都是为了实现惊人的吞吐量。

如果你的数据中心、你的工厂拥有 1 吉瓦电力,那它就不会再有更多,这就是你能获得的全部发电能力。在 1 吉瓦电力下,每瓦吞吐量就是收入,因为每一个 Token 都能产生利润,每一个 Token 都是收入。

这就是未来。计算就是收入,每瓦性能就是你的收入。只因为芯片更便宜就选择错误架构,并不会转化成真正收益,你需要确保的是每瓦收入。买得越多,赚得越多。

我现在站在大家面前,可以告诉大家:Vera Rubin 已经全面投产。我们为 Vera Rubin 建立的供应链规模,是 Grace Blackwell 的两倍。过去组装一个 Grace Blackwell 机柜需要两个小时,现在只需要五分钟。所以不仅产能更高,生产吞吐也快得多,而我们需要这一切来满足需求。

这个生态系统非同寻常。为了支持 Grace Blackwell,并为 Vera Rubin 的爬坡做准备,已经有数百万平方英尺的产能上线。我想感谢大家。Vera Rubin 已经全面投产。谢谢各位。

Vera Rubin 系统介绍

黄仁勋

Vera Rubin 不只是为了 AI 而建。Vera Rubin 不只是为了运行 AI 而建,它是为了运行代理人而建。这是一个代理式系统。请想象其中的复杂度。也正因为如此,代理人是最后一个计算机科学突破。它花了这么多年,才终于实现潜力并变得有用。能够运行它的计算机,也理应是世界上最先进的。

这就是 Vera Rubin。我们来看一下。请把 Vera Rubin 带上来。

这是 Vera Rubin,Vera Rubin NVLink 72。这是下一代系统的一部分,在下一次 GTC,我会和大家讲更多;今天我们还有很多内容要谈。这是 Vera CPU 机柜,256 颗 CPU,全部液冷。我稍后会介绍 Vera。这是 Vera BlueField 存储处理系统,也是安全系统。当然,还有我们的 Mellanox 网络,这是全球首个 CPO。这就是 Vera Rubin,令人惊叹的技术组合在一起。

当年我们打造 Hopper,是为了预训练。预训练是当时最重要的应用,也是我们面对的最重要负载。后来打造 Grace Blackwell 时,大家说:"Jensen,英伟达很擅长预训练,推理很简单。"大家还记得吗?当时很多人说:"推理很简单,我们也能做。"

但大家知道,推理等于金钱。模型非常复杂,要在极高响应速度、快速交互和高吞吐之间同时做到优秀,非常困难。这就是我们创造 NVLink 72 的原因。

今天,英伟达的 Token 成本是全球最低的。不是低 10%,而是低了数倍,甚至数量级差距。这一切都因为我们做了极致协同设计,因为我们理解推理的计算模型和计算模式,并创造了 NVLink 72。

到了 Vera Rubin,事情已经超越推理。现在是代理式系统中的推理。这就是 Vera Rubin。没有线缆,没有软管,没有风扇。上一次我把它展示给大家时,线缆到处都是。

VERA CPU:AI 代理人的 CPU

黄仁勋

Vera CPU,是为 AI 时代打造的 CPU。到目前为止,所有 CPU 都是为人打造的。我们曾经是用户,也是租户。人类使用 CPU 的方式,是生活在以秒计量的世界里。我们在云中租用 CPU,CPU 核心越多,能够出租的资源就越多。旧 CPU 的使用场景和经济学,与代理人完全不同。

代理人没有耐心。它们生活的世界不是以秒为单位,而是以纳秒为单位。代理人使用工具时,希望响应越快越好;访问数据库时,希望结果立刻返回。代理人每等待一刻,就会被阻止进入下一步、再下一步、再下一步。因此,我们必须让 CPU 尽可能低延迟、尽可能具备交互性。

这就是我们为 AI 时代创造 Vera CPU 的原因。在我们的系统里,它有三种用途。第一种当然是在 Vera Rubin 中用于思考。在 Vera Rubin 机柜里,已经有两颗 CPU。大家知道,我们正在制造并销售数以百万计的 Vera Rubin,也已经卖出了数以百万计的 Grace Blackwell。英伟达已经是全球最大的 CPU 制造商之一。

Vera Rubin 机柜里的两颗 CPU,其中一颗用于协调和管理 GPU、管理 KV 缓存,并处理机柜中运行的各种软件。我们还有 Grace BlueField,用于安全和隔离。Vera 计算部分则用于代理人框架,负责 AI 模型的协调、工具使用和数据库访问。

这里的数据服务器是 Vera BlueField,它是世界上最快的存储服务器和存储系统。它之所以至关重要,是因为代理人会以极高速度访问记忆。存储服务器和 CPU,现在已经处在数据中心最昂贵部分的关键路径上。

之所以这里最昂贵,是有充分理由的。AI 工厂的经济学核心是 Token,而 Token 在这里被创造出来。所以,你当然希望制造并生成尽可能多的 Token。经济价值都集中在这里,而 CPU 和存储系统绝不能成为阻碍。

因此,Vera CPU 给 CPU 架构带来了很大压力,这也是我们从零开始打造全新架构的原因。这是一种世界从未见过的 CPU,我们称之为 Vera。这是为代理人打造的 CPU。过去所有 CPU 都是为人类打造的,这颗 CPU 是为代理人打造的。

第一,Vera 的每时钟指令数必须极强,因为我们需要缩短延迟,缩短处理时间。我们要的是单线程性能,而不是单纯吞吐。单线程性能必须是世界级,必须是最好的。所以 Vera 的 IPC 极高,是全球最高水平:每个时钟周期抓取、解码并执行 10 条指令。

第二,CPU 进出数据所需的带宽必须达到世界级。这里既包括每核心带宽,也包括总体带宽。我前面说过,代理式系统本质上是解耦和分布式的。当计算解耦并分布式部署时,网络就成为问题。因此,我们必须尽可能快速地在 CPU 核心之间、CPU 与存储之间、CPU 与 GPU 之间移动数据。

系统周围以及 CPU 核心内部的带宽都必须达到世界级,因为 CPU 核心之间正在以极高带宽互相通信。它们不是一个核心一个核心地出租,而是全部一起协作。Vera 的横截面带宽非常惊人。它是第一个支持 PCI Express Gen 6 的系统,也率先配备 LPDDR5,带宽达到每秒 1.2 到 2 TB,是最高性能 CPU 的 2 到 3 倍。

这是为代理人打造的 CPU。这个市场一定会比上一个市场更大,因为代理人的数量会远远超过人类,而且代理人非常没有耐心。这就是 NVIDIA Vera CPU。

未来十年最重要的计算模式

黄仁勋

这真的是最重要的一页。这里的核心结论是:这就是未来十年的应用模式,也是未来十年的计算模式。代理人、代理人框架,以及由框架协调的大语言模型,每家公司都会运行它。每家公司都会成为代理人公司,每家公司内部都会有代理人运行,每家公司都会发现,代理人需要自己的操作系统。

每家公司都在问我们:如何安全地运行代理人?如何为自己的工作负载构建代理人?所以,我们有 NVIDIA 企业 AI 代理人工具包。大家其实已经看着我公开地一步步构建它。

英伟达做的几乎所有事情,大家都知道,如果回看我 5 年前或 10 年前的 GTC 演讲,你会看到我多年来一直在谈今天这些事情,因为我们一直在为这一刻做准备。

企业要构建代理人即服务,或者构建用于运营的代理人,需要四样东西。第一,需要模型。当然,大语言模型越聪明越好、越便宜越好、越快越好。第二,需要一个框架来协调整个系统。第三,这些模型想要使用工具,而这些工具带有技能。我刚刚展示过 CUDA-X 库,它们未来会成为代理人的强大工具。第四,需要一个运行时,也就是把一切连接在一起的操作系统。

这就是 NVIDIA 代理人工具包。它包括可以修改的模型,也就是 NVIDIA 世界级开源模型。我还想展示更多。你可以运行来自任何地方的代理人,可以运行 Claude Code 这样的强大代理人,也可以运行 Codex 这样的强大代理人。你可以把它们放进一个名为 Open Shell 的框架中,在企业内部实现高度安全的运行。

这个 Shell 会保护代理人,让它始终受安全策略约束。隐私受到保护,权限和特权被明确分配,身份也受到保护。因此,Open Shell 正在全球范围内被采用。NVIDIA Open Shell 是开源的,你会看到很多公司采用它,包括 Red Hat、Canonical 和 Microsoft。它会被到处采用。

这是一个重要运行时,而且这个运行时完全针对无处不在的 NVIDIA AI 平台优化。你可以在任何云、本地环境,甚至设备端运行 Open Shell。现在,你有代理人可以使用的工具和库,有可以修改或直接使用的模型,也有代理人框架。这些代理人框架现在可以在本地或其他任何地方运行。

我最喜欢的代理人用例之一,是芯片设计师。这是英伟达最重要的工作之一。因此,我们当然要和 Cadence 合作,构建一个芯片设计超级代理人。它由 Codex 或 Claude Code 协调,以 RTL、架构图、原理图或规格说明作为输入,帮助你修复需要修复的内容。我们共同打造了一些超级代理人,并用 Nemotron 针对 NVIDIA 运行时进行了优化。

英伟达致力于为世界构建开放模型,让你们、让我们所有人都能创造自己的代理人。今天,我们宣布 Nemotron 3 Ultra,这是我们的下一代开放模型,而且非常聪明。Nemotron 模型不仅给你模型,也给你我们用于训练模型的全部数据。

因为我们拥有一个强大的合作伙伴联盟,大家可以看到这里列出的所有伙伴。我们共同合作、彼此贡献数据。通过这些伟大合作关系,从模型到训练脚本,再到数据,全部都会完整开放给你们。这是开放模型的最佳形态,也是世界上最好的开放模型系统政策。目标很简单:你可以拿走所有内容,在上面继续增加,让它变得更好,并让它成为你自己的模型。

Nemotron 3 Ultra 速度快了 5 倍,成本也降低了 30%,并且完全开放。我们对此非常坚定。这是 Nemotron 3,我们现在也正在开发 Nemotron 4。正是这套由模型、框架、工具技能和运行时构成的完整工具包,让全球每一家企业都能像 Cadence 用超级代理人那样,创造属于自己的代理人。

NVIDIA 新一代个人电脑

黄仁勋

Microsoft 和 NVIDIA 将重新发明 PC。这将成为新的 PC。明晚,应该是我们这里的明晚,我会和 Satya 一起,谈更多我们过去三年共同推进的工作。Microsoft 与 NVIDIA 花了这么长时间,彻底重新思考 PC 的运行方式,就是为了准备好迎接这一刻。

正如我前面提到的,代理人这种计算模式会运行在 AI 云中,会运行在企业内部,也会运行在你的 PC 上。当 PC 拥有一个自主代理人时,会发生什么?它会帮助你,理解你。你可以和它说话,它可以看见你。你可以让它读文件,帮你做研究。它还能做更多事情,我稍后会展示。

新的操作系统,当然是旧操作系统加上大语言模型。在很多意义上,大语言模型就是现代版 DirectX。它有输入和输出,理解提示词,理解计算机视觉,可以生成视频,也可以生成声音。它是 PC、也是计算机的现代智能扩展。

在此之上,正如我前面说过,应用程序将被代理人运行时取代,而现代应用就是代理人。

各位,NVIDIA RTX Spark 笔记本电脑。谢谢。我口袋里的东西太多了。好了,这是世界上最惊人的芯片。这是我们与 MediaTek 合作打造的 N1X。我刚才好像看到了 Rick。这是 N1X,一颗漂亮的芯片。坦率说,这是一颗需要 33 年才能打造出来的芯片。

原因在于,100% 的 NVIDIA 软件栈都能在这里运行。你想做数字生物学,没问题;想做地震处理,没问题;想做天体物理,没问题。所有与 CUDA 相关的东西,所有物理、所有生物学、所有基因组学、所有 AI,都没有问题。所有计算机图形,也没有问题。

英伟达创造过的每一个应用,以及 Windows 曾经运行过的每一个应用,Microsoft 和 NVIDIA 都细致优化过,让这台计算机真正能够运行世界曾经创造过的一切。除此之外,它现在还能运行代理人。这是一台令人难以置信的计算机,我为它感到非常自豪。

这台计算机可以拥有本地 Nemotron 3 Ultra 模型,或者 Nemotron 3 超级模型;也可以连接云端的 Claude Code、Codex,或其他模型;也可以连接网络上的模型。它会工作,并完成惊人的事情。RTX Spark 是对笔记本电脑的重新发明,但事实上,Microsoft 和 NVIDIA 正在重新发明整个 PC。

今天,我们宣布一个全新产品线:三款革命性的 Windows 机器,覆盖桌面、笔记本和工作站。它们 100% 兼容 Windows,100% 支持 CUDA,100% 搭载 NVIDIA AI Tensor Core。你在全球各种 NVIDIA 平台上看到能运行的一切,都能在这里运行。

我们为此准备了路线图。这是一个全新的产品家族。每一代架构,我们都会有桌面、笔记本、工作站;下一代仍然会有桌面、笔记本、工作站。我非常高兴,也非常荣幸的是,全球 100% 的 PC 行业都加入我们,一起重新发明 PC。这是一个新产品线,也是一个新的开始。

Cosmos 3:物理 AI 的基础模型

黄仁勋

在语言模型的场景中,我们在互联网上训练所用的英文和各种语言,都是从人类视角出发的。它们由我们书写,也由我们阅读。然而,如果要为 AI 机器人创造数据,就必须从机器人的感知和视角出发。世界上绝大多数视频数据是第三人称视角,而不是第一人称视角。

因此,对于代理式系统、机器人系统和物理 AI 来说,数据是最难的问题。大家已经看到我们沿着这条阶梯向上推进。我们从遥操作开始,本质上就是人类示范。这和强化学习中的人类反馈突破并没有不同。之后,我们使用仿真,这就是 Omniverse 发挥作用的地方。这也类似于强化学习中的可验证奖励。

我们用这些系统来启动 AI 模型,启动物理 AI 模型。最终,我们能够从第三人称视角学习,并把它重新投射到第一人称视角。通过这种启动过程,我们最终拥有了一个世界基础模型,它能够从任何你想要的视角理解物理世界。第三人称、第一人称、由外向内、由内向外,都可以。这确实是一个重大突破。

今天,我们宣布 Cosmos 3。Cosmos 3 是物理 AI 的前沿。我们在语言模型上处在前沿,许多人也在研究语言模型。但在物理 AI 上,我们绝对是全球最强。我为团队能做到这一点感到无比自豪。

这是你们所有工作的基础模型。无论你想创造机器人、工厂机器人,还是在工厂里工作的机器人,只要涉及物理世界,你现在都有一个伙伴:Cosmos 3。它可以理解和推理,可以生成,可以在闭环中仿真,甚至可以成为策略本身。它在全球各类榜单上都处在领先位置。我为 Cosmos 感到非常自豪。今天,我们宣布 Cosmos 3。

过去是数据加计算得到 AI。现在我们有了 AI,计算也会成为数据。所以,使用 Cosmos 3,训练一大批 AI 模型。Cosmos 是一个非常出色的开放模型系统,它和 Nemotron 完全一样。我们开放模型,开放数据,甚至开放训练方法,让你可以为自己增强它,并把 Cosmos 变成你的专有模型。

Alpamayo 2:自驾车推理

黄仁勋

今天,我们宣布 Alpamayo 2,这是一个面向自动驾驶汽车的开放模型。我们正与全球汽车公司合作。如果看这些已经加入 NVIDIA Hyperion、正在打造 NVIDIA Hyperion 汽车的品牌,它们代表了全球大约 80% 的汽车。也就是说,这些制造商覆盖了全球 80% 左右的汽车。

未来会有大量 NVIDIA Hyperion 系统,它们能够运行 Alpamayo,也能够运行任何其他自动驾驶技术栈。我们也连接到出行服务。全球大约 97% 的出行服务正在与我们连接。因此,当我们把 Alpamayo 部署在 Hyperion 运行时和 Halos 操作系统上时,我们就能连接全球这些服务。

Isaac GR00T:人形机器人

黄仁勋

NVIDIA Isaac GR00T 是我们的人形机器人技术栈,包含模型、数据生成、仿真、运行时以及操作系统。它代表了 GR00T 平台,也就是 Isaac GR00T 平台。

大家可以看到,我们每一个系统都遵循完全相同的模式:无论是云端代理式系统、PC 上的代理式系统、自动驾驶汽车的机器人系统,还是人形机器人的机器人系统,都是同一种模式。

当然,在每一个案例里,我们都会完整构建一切。我们做垂直整合,做彻底集成,采用协同设计和极致协同设计,然后再把它开放出来,让每个人按自己需要使用其中任何部分。你想使用什么,我们甚至会帮助你修改。

但现在还缺少一件事:机器人系统需要一个参考平台。这些机器人系统太复杂了,有大量马达和传感器,也非常脆弱。然而,我们需要一种方式交付这些参考平台。就像我们为 PC、DGX、云和自动驾驶汽车所做的那样,现在我们也要为机器人这么做。

今天,我们宣布 NVIDIA Isaac GR00T,这是一个完全整合的人形机器人参考平台。它每只手有 25 个自由度,机器人本体有 31 个自由度,高 6 英尺,重 150 磅。就像我一样,只是第一个数字比我小,第二个数字比我大,其他方面差不多。

这个平台运行新的 Thor,以及我们的完整软件栈、数据生成栈、数据仿真栈和运行时。所有东西都整合进一个机器人平台,供所有人使用。我们是为高等教育和大学研究人员打造它的,因为对他们来说,自己构建这样的平台实在太难了。

复盘总结

黄仁勋

过去六个月,计算机行业已经被彻底改变。变化发生的原因是代理人终于被实现了,并且与最新前沿模型汇合,让 AI 现在能够真正做有用的工作。

这种计算模式会一遍又一遍重复:一个代理人由模型和框架组成,使用带有技能的工具,并运行在某个运行时之上。运行时取决于它是在云端、本地企业环境、PC,还是机器人里。但计算模式完全一样。

你会根据自己的偏好使用不同框架,也会根据自己的偏好使用不同模型。你会为了自己的专有用途改进它们。你会创造超级代理人,把它们租给别人,帮助别人完成工作。这个代理式平台、这种代理式模式,正是 NVIDIA 企业 AI 工具包要支持的东西。对你们来说,这是参与 AI 的很好方式;对我们来说,这也是巨大的增长机会。

Vera Rubin 已经全面投产。Grace Blackwell 是为了处理 AI,尤其是推理而打造的;Vera Rubin 是为了运行代理人而打造的。它已经全面投产。它远远不只是一颗 GPU,而是一整个解耦、分布式的代理人处理系统。

英伟达已经真正成为一家基础设施公司。不只是 GPU 公司,不只是系统公司,而是基础设施公司。我们的目标是帮助你们创造最大收入、最大利润,并尽可能快地做到这一点。

在代理人世界里,这种新的计算方式意味着 CPU 也要为代理人而建,而不是为人而建。为代理人打造的 CPU 有自己的特殊需求。我们的 NVIDIA Vera 是一次革命。我很高兴看到它的爬坡和订单情况,它会成为英伟达历史上最快、最成功的产品发布。

NVIDIA 和 Microsoft 已经创造了全新的 PC 产品线。这是一个新的开始。当然,我刚才描述的同一种代理式处理模式、代理式计算模式,也会运行在各种设备上。我提到了 PC,但未来它会出现在机器人、卫星、基站、工厂、云端、本地、边缘设备中。这种代理式 AI 系统和代理式计算模式,会在各种计算机中不断复制。我们对个人电脑的理解,很可能会发生变化。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接