K线
数据链上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
语言
  • 简体中文
  • 繁体中文
  • English
全球行情数据应用领跑者,致力于更高效地提供有价值的信息。

功能

  • 实时行情
  • 特色功能
  • AI网格

服务

  • 资讯内容
  • 开放数据(API)
  • 机构服务

软件下载

  • PC版
  • Android版
  • iOS版

联系我们

  • 聊天室
  • 商务邮箱
  • 官方邮箱
  • 官方验证通道

加入社区

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|旧版

黄仁勋:逼 DeepSeek 与华为深度绑定,这对美国太可怕了

CN
Techub News
关注
7小时前
AI 总结,5秒速览全文

撰文:小小

英伟达 CEO 黄仁勋最近接受了美国知名科技播客主持人德瓦克什·帕特尔(Dwarkesh Patel)的专访,全面回应了关于公司护城河、谷歌 TPU 竞争、对华芯片出口等关键议题。

他强调英伟达的护城河已延伸至供应链深处,通过上千亿美元的采购承诺与台积电及存储供应商建立了深度绑定。

对于 TPU 竞争,黄仁勋指出 Anthropic 只是 ASIC 增长的独特个例而非趋势。英伟达的加速计算覆盖了分子动力学、数据处理、流体力学等远超越 AI 的广阔市场,且 CUDA 的高可编程性使其能每年实现 10 到 50 倍的性能飞跃。

他同时解释了为何英伟达不亲自成为超大规模云服务商。尽管现金流充沛,英伟达仍恪守做必须做的事且尽可能少做的原则,选择通过投资 CoreWeave、OpenAI、Anthropic 等支持生态系统,而非亲自下场与客户争利。他同时承认未能更早大规模投资 Anthropic 是自己的失误。此外他强调即使 AI 革命从未发生,英伟达仍会凭借加速计算在物理、化学、数据处理等领域成为一家非常大的公司。

关于对华出口,他批评极端的出口管制政策十分幼稚。黄仁勋指出 AI 算力是芯片与能源的结合,尽管受到 EUV 光刻机的限制,中国仍拥有庞大的 7nm 芯片制造能力。考虑到当前主流大模型主要还是在 Hopper 这一代架构上训练,中国完全可以通过充沛的电力能源和扩大芯片集群规模,来弥补单颗芯片的性能差距。

不仅如此,中国庞大的 AI 研究团队正通过更高效的计算机科学来提升模型性能。黄仁勋以 DeepSeek 为例警告称这绝非无关紧要的进步。如果这类优秀的开源模型被迫专门针对华为等本土硬件进行深度优化且运行效果最佳,客观上将直接削弱美国技术栈的全球优势。他认为主动放弃全球第二大市场将迫使中国建立独立于美国的底层计算架构。随着这些基于开源标准的技术逐步向全球南方输出,美国极有可能在长期的 AI 生态标准竞争中陷入被动。

以下为黄仁勋专访全文:

控制供应链是英伟达最大护城河?

帕特尔:很多软件公司估值在跌,因为大家觉得 AI 会把软件变成大宗商品。有种看法是英伟达把设计文件发给台积电,台积电造逻辑芯片和开关,再用 SK 海力士、美光、三星的 HBM 封装,然后送到台湾地区的 ODM 那里组装成机架。本质上英伟达做的是软件,硬件是别人造的。如果软件被商品化,英伟达是否也会被商品化?

黄仁勋:最终总得有人把电子转化成 Token。这个转化过程很难被完全商品化。让一个 Token 比另一个更有价值就像让一个分子比另一个分子更有价值一样,需要大量的技术、工程、科学和发明。这些工作远未被完全理解也远未结束。我不认为这种被商品化的情况会发生。

但我们会让这个过程变得更高效。你问这个问题的方式其实就是我对公司的思考模型,输入是电子且输出是 Token,中间是英伟达。我们的原则是做必要的事但尽量少做。所谓尽量少做就是我自己不需要做的就找伙伴合作,让它成为我生态系统的一部分。

今天的英伟达可能是拥有最大合作伙伴生态系统的公司,包括上游下游供应链、所有计算机公司、应用开发者、模型厂商。AI 就像一个五层蛋糕,我们在每一层都有自己的生态。我们尽量少做但我们必须做的那部分极其困难,我不认为那部分会被商品化。

另外我也不觉得企业软件公司会被商品化。现在大多数软件公司是工具厂商,比如 Excel、PowerPoint、Cadence、Synopsys。我的看法和很多人相反,AI 智能体的数量会指数级增长且工具用户的数量也会指数级增长。这些工具的实例数量很可能会暴增。

比如 Synopsys 的设计编译器会有大量智能体来用它做布局、设计规则检查。今天限制我们的是工程师数量,明天每个工程师身后都会有一群智能体。我们能用前所未有的方式探索设计空间,用的还是今天的工具。工具的高频使用会让软件公司飞速发展。现在之所以还没发生是因为智能体还不够会用工具。要么这些软件公司自己造智能体,要么智能体会变得足够好去熟练使用这些工具,我觉得两者都会发生。

帕特尔:我看你最新的文件里对代工厂、内存、封装有近 1000 亿美元的采购承诺。半导体研究机构 SemiAnalysis 认为这个数字会达到 2500 亿美元。一种解读是英伟达的护城河在于锁定了未来多年的稀缺组件。别人或许有加速器但拿不到内存和逻辑芯片。这是否是你们未来几年的主要护城河?

黄仁勋:这是我们能做到而别人很难做到的事情之一。我们向上游做了巨大承诺,有些是显性的就是你提到的那些。有些是隐性的,比如上游很多投资是我跟那些 CEO 说我来告诉你这个行业会有多大、为什么会有这么大,我推理给你看并让你看到我所看到的,然后他们才投的。

他们为什么愿意为我投资而不是为别人?因为他们知道我有能力买下他们的供应并通过我的下游卖出去。英伟达的下游需求和下游供应链太庞大了,所以他们愿意在上游投资。

你看 GTC 大会,大家惊叹于它的规模和人气。那是整个 AI 社区聚在一起,因为他们需要互相交流与被看见。我让他们聚在一起,让下游看到上游且上游看到下游,所有人看到 AI 的进步。他们还能见到所有 AI 原生代、所有初创公司。这样他们就能亲眼验证我告诉他们的事情。我花大量时间,直接或间接地让供应链、合作伙伴、生态系统理解面前的机会。

有人说我的主题演讲像是在上课且有点折磨人。其实那就是我的用意。我得让整个供应链、上下游、生态系统理解即将发生什么、为什么发生、何时发生、规模多大,并且能像我一样系统性地思考。

关于护城河我们其实是在为未来提前布局。如果我们未来几年真的成长到万亿美元规模,到那时自然有能力搭建与之匹配的供应链。但前提是没有我们今天的业务体量和影响力也没有我们业务的高速流转,就像现金流一样供应链也有自己的流转和周转速度。如果业务周转慢没有人会愿意为一个空架子搭建供应链。我们今天能维持这样的规模,根本原因在于下游需求极其旺盛。当他们亲眼看到、听到、意识到这一切正在真实发生,才让我们得以在现有规模下做成现在这些事。

帕特尔:我想具体了解一下上游能否跟得上。你们连续多年收入翻倍,每年向世界提供的算力增长超过两倍。

黄仁勋:在这个规模上还能翻倍确实很惊人。

帕特尔:但你看逻辑芯片。你们是台积电 N3 节点的最大客户也是 N2 节点的最大客户之一。SemiAnalysis 发现今年 AI 会占 N3 产能的 60%,明年到 86%。如果你已经占了大头怎么翻倍?年复一年地翻倍?我们是否已经进入一个阶段,即 AI 算力增速必须因为上游限制而放缓?你看到解决办法了吗?归根到底我们怎么才能年复一年地把晶圆厂产能也翻一倍?

黄仁勋:在任何一个时间点,瞬时需求都可能大于全球上下游的总供应。甚至可能被水管工数量限制,这确实发生过。

帕特尔:水管工应该被邀请参加明年的 GTC。

黄仁勋:好主意。但这其实是个好现象。你希望一个行业的瞬时需求大于总供应,反过来就不太好了。如果某个组件缺口太大,整个行业会蜂拥去解决。你看现在已经没太多人讨论 CoWoS 了。因为过去两年我们拼命解决这个问题现在情况已经不错了。台积电现在知道 CoWoS 的供应必须跟得上逻辑和内存的需求。他们正在以和扩展逻辑同样的速度扩展 CoWoS 和未来封装技术。这非常好,因为 CoWoS 和 HBM 内存以前是比较小众的,现在它们成了主流计算技术。

我们现在能影响更广泛的供应链了。AI 革命刚开始时我说的这些话五年前就说过了。有人相信并投资了,比如美光 CEO 桑杰·梅赫罗特拉(Sanjay Mehrotra)及其团队。我清楚记得那次会议,我准确地说明了会发生什么、为什么发生以及今天的状况。他们真的加倍投入了。我们在 LPDDR 和 HBM 内存上合作,他们大力投资结果取得了巨大的成功。有些人来得晚一些但现在都来了。

每个瓶颈都会得到大量关注。我们现在提前几年就开始预判瓶颈。比如过去几年我们在 Lumentum、Coherent 和硅光生态系统上的投资,重塑了供应链。我们围绕台积电建立了整个供应链并和他们合作开发硅光整合平台 COUPE,发明了很多技术并把专利授权给供应链保持开放。

我们通过发明新技术、新流程、新测试设备比如双面探测、投资公司帮他们扩产来增强供应链。我们在努力塑造生态系统,让供应链能够支撑这个规模。

帕特尔:有些瓶颈好像比其他瓶颈容易解决,比如 CoWoS 扩产。

黄仁勋:我们负责克服最难的那个。

帕特尔:哪个?

黄仁勋:水管工和电工。这是我担心那些末日论者的地方。他们说工作要消失、岗位要完蛋。如果我们阻止人们成为软件工程师,我们就会耗尽软件工程师。十年前就有同样的预言。有些末日论者说无论如何别当放射科医生,你现在还能在网上看到那些视频说放射科会是第一个消失的职业,世界再也不需要放射科医生了。猜猜我们现在缺什么?放射科医生。

帕特尔:有些东西可以规模化有些则不行,你每年怎么造出两倍的逻辑芯片?最终内存和逻辑都受限于 EUV 光刻机。你怎么年复一年地拿到两倍的 EUV 光刻机?

黄仁勋:这些产能都是可以快速规模化的,两三年内就能做到。你只需要向供应链发出一个需求信号。能造一个就能造十个,能造十个就能造一百万个。这些东西复制起来并不难。

帕特尔:你会在供应链里走多远?会直接去找 ASML 说三年后英伟达要做到年收入两万亿美元,我们需要多得多的 EUV 光刻机吗?

黄仁勋:有些要直接说,有些间接说。如果能说服台积电,ASML 也会被说服。我们要找到关键的瓶颈点。但如果台积电被说服了,几年内你就会有足够多的 EUV。

我的观点是没有任何瓶颈会持续超过两三年。与此同时我们还在把计算效率提高 10 倍、20 倍,Hopper 到 Blackwell 是 30 到 50 倍。因为 CUDA 很灵活我们在不断发明新算法、新技术,在增加容量的同时提高效率。这些事情都不让我担心。让我担心的是我们下游的东西。能源政策阻止能源扩展,而没有能源你建不了新产业。没有能源你没法搞一个新的制造业。

我们要让美国再工业化。我们要把芯片制造、计算机制造、封装带回来。我们要造电动汽车、机器人。我们要造 AI 工厂。没有能源这些都建不起来,而能源需要很长时间。芯片产能是两三年能解决的问题。CoWoS 产能也是两三年能解决的问题。

TPU 会打破英伟达对 AI 算力的控制吗?

帕特尔:世界上排名前三的模型里,有两个即 Claude 和 Gemini 都是在谷歌 TPU 上训练的。这对英伟达意味着什么?

黄仁勋:我们做的东西很不一样。英伟达做的是加速计算,不只是一个张量处理单元。加速计算可以用在很多地方,涵盖分子动力学、量子色动力学、数据处理、结构化数据、非结构化数据、流体动力学、粒子物理。除此之外也做 AI。

加速计算比这广泛得多。虽然 AI 是当下的话题且显然很重要和影响很大,但计算比这宽泛得多。英伟达重塑了计算的方式,从通用计算转向加速计算。我们的市场覆盖范围比任何 TPU 或 ASIC 都要大得多,我们是唯一一家能加速各种应用的公司。我们有巨大的生态系统,各种框架和算法都能在英伟达上跑。

因为我们的计算机设计成让别人可以操作,所以任何运营商都能买我们的系统。而大部分自建系统你得自己当运营商,因为它们的灵活性不够导致别人操作不了。因为谁都能搭建并操作我们的系统,所以我们存在于每一个云里,包括谷歌、亚马逊、Azure 以及甲骨文的云平台。

如果你想租给别人用,那你最好有来自很多行业的庞大客户群做承购方。如果你想自己用,我们当然也能帮你自己运营,就像我们在 xAI 帮马斯克那样。而且我们能让任何公司、任何行业的运营商都具备能力,你可以给礼来公司建一台用于科学研究和药物发现的超级计算机,我们可以帮他们运营,用于整个药物发现和生物科学领域。

有一大堆应用是 TPU 做不了的。英伟达的 CUDA 也是一个很棒的张量处理单元,但它还能处理数据处理的每一个环节、计算、AI 等等。我们的市场机会大得多,覆盖范围广得多。因为我们支持现在世界上每一个应用,你可以在任何地方建英伟达系统并且知道一定会有客户。这是一个很不一样的局面。

帕特尔:你们的收入很惊人但不是来自制药也不是来自量子计算,而是主要来自 AI。因为 AI 这个前所未有的技术正在以史无前例的速度增长。那问题就来了,什么才是对 AI 本身最有利的?TPU 本质上是一个巨大的脉动阵列,特别擅长做矩阵乘法。GPU 则更灵活且适合那些有很多分支判断或者内存访问不规则的任务。但问题在于 AI 到底在干什么?说白了 AI 就是一遍又一遍地做那些非常可预测的矩阵乘法。既然如此你为什么还要在芯片上留出面积给线程束调度器或线程与内存体之间的切换这类通用功能呢?这些面积本来可以全部用来做矩阵乘法。而 TPU 恰恰就是专门针对当下正在爆发的那部分计算需求设计的。你觉得呢?

黄仁勋:矩阵乘法是 AI 的重要部分但不是全部。如果你想出一种新的注意力机制、换一种分解方式、或者发明一个全新的架构即混合状态空间模型(SSM),你需要一个普遍可编程的架构。如果你想做一个融合了扩散模型和自回归的模型,你需要的也是一个普遍可编程的架构。我们能跑你能想到的任何东西。这就是优势。因为它是可编程的,所以发明新算法要容易得多。

发明新算法的能力才是 AI 进步这么快的原因。TPU 和其他东西一样都受摩尔定律影响,每年大概进步 25%。要每年实现 10 倍或 100 倍的飞跃,唯一的方法是每一年都从根本上改变算法和计算方式。

这就是英伟达的根本优势。Blackwell 比 Hopper 能效高 50 倍。我第一次说 35 倍时没人信。后来有人写文章说我留了一手实际上是 50 倍。单靠摩尔定律做不到,我们靠的是新模型比如专家混合模型(MoE),它们被并行化、分解、分布在整个计算系统里。如果没有 CUDA 也没有真正深入去写新内核的能力,这很难做到。

这是可编程架构和英伟达极端协同设计能力的结合。我们甚至可以把一些计算卸载到网络结构本身比如 NVLink,或者网络里的 Spectrum-X。我们可以同时改变处理器、系统、网络结构、库和算法。没有 CUDA 我根本不知道从哪下手。

帕特尔:这引出一个关于英伟达客户的有趣问题。你们 60%的收入来自五个超大规模云厂商。在另一个时代客户是教授做实验,他们需要 CUDA 且用不了别的加速器,他们只需要用 CUDA 跑 PyTorch 且一切都优化好了。但这些超大规模云厂商有能力自己写内核。事实上为了从特定架构里挤出最后 5%的性能,他们必须这么做。Anthropic 和谷歌主要跑自己的加速器即 TPU 和 Trainium。就连用 GPU 的 OpenAI 也有 Triton 因为他们需要自己的内核。他们不用 cuBLAS 和 NCCL 而是有自己的软件栈也能编译到其他加速器上。如果你的大部分客户能且正在做 CUDA 的替代品,那 CUDA 在多大程度上还是前沿 AI 跑在英伟达上的关键因素?

黄仁勋:CUDA 是一个丰富的生态系统。如果你想在任何计算机上做开发,首选 CUDA 是非常明智的。因为生态系统太丰富了,我们支持每一个框架。如果你想写自定义内核,我们对 Triton 的贡献巨大,Triton 的后端有大量英伟达技术。

我们很乐意帮助每一个框架变得更好。框架很多比如 Triton、vLLM、SGLang。现在又冒出一堆强化学习框架比如 verl 和 NeMo RL。后训练和强化学习这块正在爆炸。所以如果你想基于某个架构做开发选 CUDA 最有意义,因为你知道它的生态很好。

你知道如果出了问题,问题更可能出在你自己的代码里而不是底下那堆积如山的底层系统上。别忘了你面对的是多么庞大的代码规模。当系统不工作时你要问自己是我错了还是计算机错了?你当然希望每次都发现是自己错了,因为只有这样你才能始终信任计算机。显然我们自己还有很多 bug。但关键在于我们的系统已经被无数次检验过,你可以放心地在上面构建。这就是我想说的第一点即生态系统的丰富性、可编程性和能力。

第二点如果你是个开发者,你最想要的是一个装机基础。你希望自己的软件能跑在很多其他计算机上。你不是只为自己写软件而是为你所在的集群或别人的集群写,因为你是框架开发者。英伟达的 CUDA 生态系统最终就是它最大的财富。

我们现在有数亿个 GPU 在外面,每个云里都有。从 A10、A100、H100、H200 到 L 系列、P 系列以及各种尺寸和各种形状。如果你是个机器人公司,你希望那个 CUDA 堆栈能直接在机器人内部运行。我们几乎无处不在。这个装机基础意味着一旦你开发了软件或模型,它在任何地方都能用。这个价值无可估量。

最后我们存在于每一个云里,这让我们真正独一无二。如果你是个 AI 公司或开发者,你不确定会和哪个云服务商合作也不知道想把负载跑在哪里。没关系,我们无处不在包括你自己的机房。生态系统的丰富性、装机基础的广泛性、存在位置的多样性,这些加在一起让 CUDA 价值连城。

帕特尔:有道理。但我想问的是这些优势对你最大的客户来说到底有多重要?对很多人来说 CUDA 可能很有价值。但你收入的大头其实来自那些有能力自己搭建软件栈的大客户。特别是如果未来 AI 进入一些可以用强化学习进行严格验证的领域,那问题就变成了谁能写出在大型集群上跑得最快的矩阵乘法和注意力内核?这是一个非常可验证的优化问题。

那些超大规模云厂商完全有能力自己写这些定制内核。当然英伟达的性价比可能还是更好所以他们可能依然会选择英伟达。但这样一来问题就变成了最后是不是只比谁的硬件规格更好以及每美元能买到的算力和带宽更多?

历史上英伟达靠着 CUDA 护城河,在 AI 硬件和软件上都能保持 70%以上的利润率。但现在的问题是如果你最大的客户其实有能力绕过这条护城河,你还能维持这么高的利润率吗?

黄仁勋:我们分配给这些 AI 实验室的工程师数量是惊人的,跟他们一起工作优化他们的软件栈。原因是没人比我们更懂我们的架构。这些架构不像 CPU 那么通用。CPU 有点像凯迪拉克且好开和不飙快车,谁都能开得不错且有巡航控制,一切都很简单。而英伟达的 GPU 和加速器更像 F1 赛车。我能想象每个人都能开到 160 公里时速,但要推到极限需要相当多的专业知识。我们用大量 AI 来写内核。

我很确定在相当长一段时间内我们仍然会被需要。我们的专业知识常常能让 AI 实验室合作伙伴轻松再提升 2 倍性能。优化完一个内核或整个软件栈后,模型速度提升 50%、2 倍乃至 3 倍,这很常见。考虑到他们拥有所有 Hopper 和 Blackwell 的集群规模,这是一个巨大的数字。提升一倍直接等于收入翻倍。

英伟达的计算堆栈在总拥有成本 TCO 上是全世界最好的,没人能比。没有任何一个平台能向我展示出比我们更好的性能与 TCO 比。Dylan 的 InferenceMAX 基准测试就摆在那里,谁都可以用。但 TPU 不来测且 Trainium 也不来测。我很鼓励他们用 InferenceMAX 来展示自己所谓的超低推理成本。但很难因为没人愿意来。

还有 MLPerf,我也很想让 Trainium 来展示他们一直宣称的 40%优势。也很想听他们展示 TPU 的成本优势。但在我看来从第一性原理出发他们说的那些优势完全说不通。所以我认为我们成功的原因很简单就是我们的 TCO 太好了。

第二你说我们 60%的客户是前五大云厂商,但这些业务大部分是面向外部的。比如 AWS 中使用英伟达的芯片大部分是给外部客户而不是内部用。Azure 里的客户显然也都是外部的,甲骨文的同样如此。他们青睐我们是因为我们的影响力大,我们能给他们带来全世界最优秀的客户且这些客户都建在英伟达上。而这些公司之所以建在英伟达上,是因为我们的影响力和多功能性太强了。

所以我认为这个飞轮是装机基础、架构的可编程性、生态系统的丰富性,再加上世界上有成千上万家 AI 公司。如果你是 AI 初创公司你会选哪个架构?你会选最丰富的而我们就是最丰富的,你会选安装基础最大的而我们就是最大的,你会选生态最完善的。这就是飞轮。

结合以上几点来看我们的每美元性能最好且客户的 Token 成本最低。我们的每瓦性能世界最高,所以如果一个合作伙伴建了一个 1 吉瓦的数据中心,这个数据中心最好能产出最大量的收入和 Token,这直接等于收入。你希望它产出尽可能多的 Token 来最大化收入,而我们是世界上每瓦 Token 数最高的架构。另外如果你的目标是出租基础设施,我们有世界上最多的客户。这就是飞轮运转的原因。

帕特尔:有意思。我想问题归根结底是实际的市场结构到底是什么样?因为即使有其他公司存在,可能有一个世界里面成千上万家 AI 公司每家都占大致相等的算力份额。但现实情况是即便通过这五大云厂商,真正在亚马逊上用算力的其实是 Anthropic、OpenAI 以及那些大型基础实验室。这些大玩家自己有能力也有资源让不同的加速器跑起来。

如果你说的这些关于性价比和每瓦性能等等都是真的,那为什么像 Anthropic 这样的公司几天前刚宣布和博通与谷歌达成一项涉及多吉瓦的 TPU 交易,把他们大部分算力放在上面?对谷歌来说 TPU 也占了他们绝大部分算力。所以如果我看这些大型 AI 公司似乎他们的算力曾经全是英伟达现在不是了。我很好奇如果纸面上这些优势都成立,他们为什么偏偏选了别的加速器?

黄仁勋:Anthropic 只是一个特例并不是什么大趋势。你可以想一想如果没有 Anthropic 这家公司,TPU 哪来的增长?百分之百是因为 Anthropic。同样如果没有 Anthropic,Trainium 又哪来的增长?百分之百也是因为 Anthropic。这基本上是公开的秘密了。不是什么 ASIC 的机会变得很多而是只有一个 Anthropic 而已。

帕特尔:但 OpenAI 和 AMD 有交易且他们自己在造 Titan 加速器。

黄仁勋:是的,但我觉得大家都承认他们绝大部分算力还是跑在英伟达上。我们仍然会一起做很多工作。我不介意别人用别的东西、尝试别的东西。如果他们不尝试怎么知道我们的有多好?有时候你需要被提醒一下。我们必须不断赢得我们现在的位置。

总有人夸下海口。你看看有多少 ASIC 项目被取消了。仅仅因为你要造一个 ASIC 你还得造出比英伟达更好的东西这没那么容易。实际上这不合理除非英伟达一定有什么缺陷。但我们的规模和速度摆在这里,我们是世界上唯一一家每年都推出新品的公司且每年都实现巨大飞跃。

帕特尔:我猜他们的逻辑是它不需要比英伟达更好,只要不比 70%差太多就行,因为他们付给你 70%的利润率。

黄仁勋:不,别忘了 ASIC 的利润率也很高。假设英伟达利润率是 70%且 ASIC 利润率是 65%。你到底省了什么?

帕特尔:你是说像博通那样的?

黄仁勋:对。你得付钱给别人。据我所知 ASIC 利润率非常高,他们自己也这么认为且对他们惊人的 ASIC 利润率很自豪。

所以你问为什么。很久以前我们就是没能力做。当时我没有深刻意识到做一个像 OpenAI、Anthropic 这样的基础 AI 实验室有多难以及他们需要供应商本身的巨额投资。我们当时没能力投资 Anthropic 几十亿美元来换取他们用我们的算力。但谷歌和 AWS 有能力。他们一开始就投入巨资且作为回报 Anthropic 用了他们的算力。我们当时就是没能力。

我的失误是我没有深刻意识到他们真的别无选择,没有风投会投 50 到 100 亿美元到一个 AI 实验室指望它变成 Anthropic,这是我的失误。但即使我当时理解了我也不认为我们有能力那么做。但我不会再犯同样的错误了。

我很乐意投资 OpenAI 也很乐意帮他们扩展,我相信这是必要的。后来当我有能力时 Anthropic 来找我们,我很乐意成为投资者且很乐意帮他们扩展。我们当时就是做不到。如果我能让一切重来,如果当时的英伟达有现在这么大我会非常乐意那么做。

英伟达为什么不成为超大规模云厂商?

帕特尔:多年来英伟达一直是 AI 领域赚钱并赚大钱的公司。现在你在投资,比如据报道你们已向 OpenAI 投了 300 亿美元并向 Anthropic 投了 100 亿美元。现在他们的估值涨了且我相信还会继续涨。所以如果这些年来你一直在给他们提供算力且你看到了它的发展方向,而他们一两年前的价值只有现在的十分之一甚至一年前,而你又有那么多现金,那要么英伟达自己成为一个基础实验室投入巨资去做,要么在现在这个估值下更早地做你这些交易。而且你有现金。所以为什么不更早做呢?

黄仁勋:我们在力所能及的时候尽快做了且一有能力就尽快做了。如果我能我会更早做。在 Anthropic 需要我们做的时候我们就是没能力,那时这不在我们的考虑范围内。

帕特尔:怎么讲?是钱的问题吗?

黄仁勋:是的即投资规模。我们当时从未在公司外部做过投资,更不用说那么大数额了。我们没有意识到我们需要这么做。我一直以为他们可以像所有公司一样去风投那里融资。但他们想做的事风投做不到。OpenAI 想做的事风投做不到。我现在认识到了但我当时不知道。

但这就是他们的天才之处,他们聪明就聪明在这里。他们当时就意识到必须做那样的事。我很高兴他们做到了。即使这导致 Anthropic 去找了别人,我仍然很高兴它发生了。Anthropic 的存在对世界是好事且我为此高兴。

帕特尔:我想你们仍然在赚很多钱而且每个季度都赚得更多。既然你有这么多不断赚来的钱,英伟达应该用它做什么?有一个答案是已经出现了一整套中间商生态系统,把资本支出转化为这些实验室的运营支出让他们可以租算力。因为芯片很贵但它们生命周期里能赚很多钱,因为 AI 模型越来越好。它们产生的 Token 价值在增加但部署成本高。英伟达有钱做资本支出。事实上据报道你们正在支持 CoreWeave 且金额高达 63 亿美元并已经投了 20 亿。英伟达为什么不自己成为一个云服务商?为什么不自己成为超大规模云厂商并自己出租算力?

黄仁勋:这是我们公司的理念且我认为是明智的。我们应该做必要的事但尽量少做。意思是说在我们构建计算平台的工作上如果我们不做,我真心相信没人会做。如果我们不冒我们冒的那些险,如果我们不按我们的方式做 NVLink 并不构建整个软件栈,不按我们的方式创建生态系统并不投入 20 年 CUDA 并在大部分时间里亏损,如果我们不做没人会做。

如果我们不创建所有 CUDA-X 库使它们面向特定领域,十五年前我们开始做特定领域库,因为我们意识到如果我们不创建这些特定领域库,无论是光线追踪、图像生成还是早期 AI 工作、这些模型,或者数据处理、结构化数据处理、向量数据处理,如果我们不创建没人会做。我完全相信这一点。我们为计算光刻做了一个库叫 cuLitho,如果我们不做没人会做。所以加速计算之所以能有今天的进步是因为我们做了这些。

所以我们应该做那件事且应该全身心投入并全力以赴去做。然而世界上有很多云,如果我不做总有人会做。所以我们奉行做必要的事但尽量少做的理念,它存在于我们公司的每一天。我做的每一件事都用这个视角来看。

就云而言如果我们不支持 CoreWeave 存在,这些新云、这些 AI 云就不会存在。如果我们不帮 CoreWeave 它们就不会存在。如果我们不支持 Nscale 他们就不会有今天的成就。如果不支持 Nebius 他们也不会是今天这样。现在他们做得非常好。

这是一种商业模式。我们应该做必要的事且尽量少做。所以我们投资于我们的生态系统因为我希望我的生态系统蓬勃发展。我希望这个架构、AI 能够连接尽可能多的行业、尽可能多的国家,让整个星球都建立在 AI 之上并建立在美国技术栈之上。这个愿景正是我们在追求的。

还有一件事,有很多优秀的基础模型公司且我们尽量投资所有人。这是我们做的另一件事。我们不挑赢家且我们需要支持所有人。这是我们应该做的也是我们的乐趣所在。这对我们的业务至关重要。但我们也不遗余力地不去挑赢家所以我投了一家就会投所有。

帕特尔:你为什么特意不挑赢家?

黄仁勋:首先这不是我们的工作。其次英伟达刚起步时有 60 家 3D 图形公司而我们是唯一活下来的。如果你从这 60 家里猜谁会成功,英伟达会排在最不可能成功名单的首位。

这是很久以前的事了。英伟达的图形架构恰恰是错的且不是有点错。我们造了一个完全错的架构,开发者没法支持它且它永远不会成功。我们基于良好的第一性原理推理但最终得出了错误的解决方案。每个人都会把我们排除在外但我们活下来了。

所以我有足够的谦逊认识到这一点即不要挑赢家。要么让他们自己照顾自己,要么就照顾所有人。

帕特尔:有一点我没明白,你说我们不是因为他们是新云就优先考虑他们想扶持他们,但你也列举了一堆新云说没有英伟达它们就不会存在。这两件事怎么兼容?

黄仁勋:首先他们自己得想存在并且来请求我们帮助。当他们想存在并且有商业计划、专业知识和热情时,他们显然觉得自己有些能力。但如果归根结底他们需要一些投资来启动,我们会支持他们。但他们越早启动飞轮越好。

你的问题是我们想不想做融资业务?答案是不想。有人在做融资业务,我们宁愿和他们合作而不是自己当融资方。我们的目标是专注于我们做的事且保持商业模式尽可能简单并支持我们的生态系统。

当像 OpenAI 这样的组织需要 300 亿美元规模的投资因为他们在 IPO 之前,而我们深信他们会成为一家不可思议的公司,世界需要他们存在且世界希望他们存在,我希望他们存在并且他们顺风顺水,让我们支持他们并让他们扩展。这些投资我们会做因为他们需要我们。但我们不是想做尽可能多的事而是想做尽可能少的事。

帕特尔:这可能是个显而易见的问题,但我们在 GPU 短缺的情况下过了好几年,现在因为模型变好导致短缺还在加剧。

黄仁勋:我们确实缺 GPU。

帕特尔:是的。英伟达以分配稀缺配额而闻名,不只看谁出价高而是看我们希望确保这些新云存在,比如给 CoreWeave 一些,给 Crusoe 一些,给 Lambda 一些。这对英伟达有什么好处?首先你同意这种分化市场的描述吗?

黄仁勋:不同意。你的前提完全错了。我们对这些事情足够谨慎且非常谨慎。第一如果你不下采购订单光说没用。在收到采购订单之前我们能做什么?所以第一件事是我们和每个人努力工作完成预测,因为这些东西要很长时间才能造好且数据中心也要很长时间。我们通过预测等方式来协调供需这是首要任务。

第二我们尽量和尽可能多的人做预测但最终你还是得下订单。也许无论什么原因你没下订单,我能怎么办?在某个时间点先到先得。除此之外如果你的数据中心还没准备好,或者某些组件还没准备好让你启用数据中心,我们可能会先服务别的客户。这只是为了最大化我们自己工厂的吞吐量且我们可能会做一些调整。

除此之外优先顺序是先到先得。你得下采购订单。当然有一些故事。比如这一切始于一篇关于拉里·佩奇和马斯克跟我吃饭时求取 GPU 的文章,那从未发生。我们确实吃了饭且是很愉快的一顿饭但他们从未求取 GPU。他们只是需要下订单。一旦下了订单我们会尽力把产能分配给他们这不复杂。

帕特尔:好。所以听起来有一个队列,然后根据数据中心是否准备好、何时下采购订单,你在某个时间拿到货。但这听起来仍然不是价高者得。有什么理由不那样做?

黄仁勋:我们从不那样做。

帕特尔:为什么不是价高者得?

黄仁勋:因为那是不好的商业实践。你定好价格然后人们决定买不买。我理解芯片行业其他人会在需求高时涨价但我们不那样做。这从来不是我们的做法。你可以信赖我们。我宁愿做个可靠的人并做行业的基石。你不用事后猜测。如果我报了一个价那就是那个价,就这样。如果需求飙升价格依然稳定。

帕特尔:另一方面这就是你们和台积电关系好的原因吧?

黄仁勋:是的,英伟达和他们做生意快 30 年了。英伟达和台积电没有签署法律合同但总有一些粗略的公平。有时我对且有时我错。有时我拿了好 deal 且有时我拿了差 deal。但总体而言这段关系非常好。我可以完全信任他们并且可以完全依赖他们。

你可以信赖英伟达的一点是今年的 Vera Rubin 会不可思议。明年 Vera Rubin Ultra 会来。后年 Feynman 会来。再后一年我还没介绍名字。每一年你都可以信赖我们。你去找世界上任何其他 ASIC 团队随便挑,你能说我可以把全部业务押在你身上且你每年都会为我服务吗?你能说你的 Token 成本每年都会下降一个数量级且我可以像相信时钟一样相信你吗?

我刚才对台积电说了类似的话。对历史上任何其他代工厂你都不可能这么说。但今天你可以对英伟达这么说。你可以每年都信赖我们。如果你想买 10 亿美元的 AI 工厂没问题。想买 1 亿美元没问题。1000 万美元或者只有一个机架都没问题。或者只有一个显卡没问题。如果你想下 1000 亿美元的订单也没问题。我们是当今世界上唯一一家你可以这么说的公司。

我也可以对台积电这么说。我想买一个或者买十亿个都没问题。我们只需要经过规划流程以及所有成熟的人会做的事。所以我认为英伟达能成为世界 AI 产业的基石,这个地位我们花了几十年才达到。这是巨大的承诺和巨大的奉献。我们公司的稳定性与一致性非常重要。

是否应该向中国销售 AI 芯片?

帕特尔:我想问关于中国的问题。我实际上不知道我是否支持向中国卖芯片但我喜欢对嘉宾唱反调。达里奥·阿莫代伊(Dario Amodei)支持出口管制,我问他为什么美国和中国不能都在数据中心里拥有一群天才?但既然你站在另一边我会反过来问你。

一种思考方式是 Anthropic 几天前发布了 Mythos 预览版。这个模型他们甚至没有公开发布,因为他们说它有很强的网络攻击能力且世界还没准备好,要等他们把那些零日漏洞修补好。但他们说它发现了所有主流操作系统和每个浏览器的成千上万个高危漏洞。它在 OpenBSD 里发现了一个漏洞且那个是专门设计来避免零日漏洞的操作系统,这个漏洞存在了 27 年。

所以如果中国公司、中国实验室、中国政府能拿到 AI 芯片,来训练一个像 Claude Mythos 这样有网络攻击能力的模型并用更多算力跑几百万个实例,这是否对美国公司、美国国家安全构成威胁?

黄仁勋:首先 Mythos 是在相当普通的算力上训练的且算力规模也相当普通,只不过训练它的是一家非常优秀的公司。它所用的算力类型和数量在中国其实非常充足。你要知道芯片在中国是存在的。

他们制造了全球 60%以上的主流芯片,这个产业对他们来说非常大。他们拥有世界上最厉害的计算机科学家之一。如你所知几乎所有 AI 实验室里大部分研究人员都是中国人,占了全球 50%的 AI 研究人员。所以问题来了,既然他们已经拥有这么多资产如充足的能源与大量的芯片以及全球近半的 AI 人才,如果你真的担心他们,那么创造一个更安全的世界最好的方式是什么?

去打压他们把他们变成敌人可能不是最好的答案。他们是竞争对手且我们希望美国赢。但我认为进行对话、进行研究对话可能是最安全的。由于我们目前对中国的态度在这个领域明显缺失。我们的 AI 研究人员和他们的 AI 研究人员交流至关重要。我们双方都试图就 AI 不应该被用来做什么达成一致,这至关重要。

关于在软件里找漏洞,当然这正是 AI 应该做的。它会在很多软件里找到漏洞吗?当然。有很多漏洞。AI 软件里也有很多漏洞。这正是 AI 应该做的,我很高兴 AI 达到了一个水平能帮我们提高这么多生产力。

有一件事被低估了,就是围绕网络安全、AI 网络安全、AI 安全、AI 隐私的生态系统非常丰富。有一整个 AI 初创公司生态系统在试图为我们创造那个未来,即一个不可思议的 AI 智能体周围有成千上万个 AI 智能体在保护它并确保它安全。那个未来一定会到来。

认为会有一个 AI 智能体到处跑而没人看着这有点疯狂。我们很清楚这个生态系统需要蓬勃发展。事实证明这个生态系统需要开源且需要开放模型和开放软件栈,这样所有 AI 研究人员与所有厉害的计算机科学家才能去构建同样强大的 AI 系统并保证 AI 的安全。所以我们需要确保的一件事是保持开源生态系统的活力,这不能被忽视。其中很多来自中国且我们不应该扼杀它。

关于中国当然我们希望美国拥有尽可能多的算力。我们受限于能源但有很多人在解决这个问题,我们不能让能源成为国家的瓶颈。但我们也希望世界上所有的 AI 开发者都在美国技术栈上开发,并把 AI 的进步尤其是开源的部分贡献给美国生态系统。创建两个生态系统将是极其愚蠢的,一个开源的且只能跑在外国技术栈上,一个封闭的且跑在美国技术栈上。我认为这对美国将是可怕的后果。

帕特尔:信息量很多,我梳理一下。中国有算力但有些估计说因为他们没有 EUV 也就是因为芯片制造出口管制,他们实际能生产的 Flops 只有美国的十分之一。那么他们最终能训练出像 Mythos 这样的模型吗?能。但问题在于因为我们有更多的 Flops,美国实验室能先达到这些能力水平因为 Anthropic 先达到了。

另外就算他们训练出这样的模型,大规模部署的能力也很重要。如果你有个网络黑客有一百万个实例比有一千个危险得多。所以推理算力真的很重要。事实上他们有这么多优秀的 AI 研究人员,这恰恰是可怕的地方,因为让这些工程师研究人员更高效的是什么?是算力。

如果你和美国任何一个 AI 实验室聊他们会说限制他们的是算力。DeepSeek 创始人、通义千问领导层都说过。他们说他们受限于算力。那么问题来了,我们让美国公司因为有更多算力而先达到 Mythos 级别的能力并让我们的社会为此做好准备,这不是更好吗?而中国因为算力少会更晚达到这个水平?

黄仁勋:我们的目标当然应该始终是第一个到达也始终拥有更多算力。但要让你描述的那种结果成立,你必须把情况推到极端也就是他们得完全没有算力。只要他们还有一些算力,问题就变成了到底需要多少才够?事实上中国拥有的算力是巨大的。你刚才也说了他们是世界第二大计算市场。如果他们真想集中算力做一件事他们完全有能力做到。

帕特尔:但这是真的吗?有人估计说中芯国际在工艺节点上落后。

黄仁勋:他们拥有的能源是惊人的对吧?AI 是个并行计算问题不是吗?为什么他们不能因为能源几乎免费就把 4 倍、10 倍的芯片放在一起?他们有这么多能源。他们有完全空置且完全通电的数据中心。他们的基础设施容量巨大。如果他们想他们就把更多芯片聚在一起即使是 7 纳米的。

他们制造芯片的能力是世界上最大的之一,半导体行业知道他们垄断了主流芯片。他们有超额产能且产能过剩。所以认为中国将无法获得 AI 芯片的想法完全是胡说八道。当然如果你问我如果全世界根本没有算力美国会不会遥遥领先?但那不是一个真实场景。他们已经拥有大量算力。你担心的那个阈值他们已经达到并超过了。

所以我认为你误解了,AI 是一个五层蛋糕,最底层就是能源。当你能源充足时它可以弥补芯片的不足。如果你芯片充足它可以弥补能源的不足。例如美国能源稀缺,这就是为什么英伟达必须不断推进架构并做极端协同设计,以便在芯片运出量少的情况下因为能源太有限而我们的每瓦吞吐量高得离谱。

但是如果你的瓦特数完全充足且几乎是免费的,你会在乎每瓦性能吗?你会有很多。你可以用旧芯片来做。7 纳米芯片基本上就是 Hopper。我必须告诉你今天的模型大部分是在 Hopper 这一代上训练的。所以 7 纳米芯片已经足够好了。能源丰富是他们的优势。

帕特尔:但还有他们能否制造足够多芯片的问题。

黄仁勋:但他们能。证据是什么?华为刚刚度过了公司历史上业绩最好的一年。

帕特尔:他们出货了多少芯片?

黄仁勋:大量。数百万个,比 Anthropic 拥有的多得多。

帕特尔:问题在于中芯国际能生产多少逻辑芯片以及能生产多少内存?

黄仁勋:我告诉你实际情况。他们有大量的逻辑芯片也有大量的 HBM2 内存。

帕特尔:但如你所知训练和推理的瓶颈往往是带宽量。所以如果你用的是 HBM2,我不记得具体数字,但和你最新的产品比内存带宽可能差了一个数量级,这非常大。

黄仁勋:华为是一家网络公司。

帕特尔:但这不能改变你需要 EUV 来制造最先进 HBM 的事实。

黄仁勋:完全不对。你可以把它们聚在一起就像我们用 NVL72 聚在一起一样。他们已经展示了硅光子技术,把所有计算连成一个巨大的超级计算机。你的前提完全错了。

事实是他们的 AI 发展进展得相当顺利。世界上最好的 AI 研究人员因为他们算力有限,他们也提出极其聪明的算法。记住我刚才说摩尔定律每年大约进步 25%。然而通过优秀的计算机科学我们仍然可以把算法性能提高 10 倍。我的意思是优秀的计算机科学才是杠杆。

毫无疑问 MoE 是一个伟大的发明。所有那些令人难以置信的注意力机制减少了计算量。我们必须承认 AI 的大部分进步来自算法进步而不仅仅是原始硬件。如果大部分进步来自算法、计算机科学和编程,那告诉我他们的 AI 研究大军不是他们的根本优势?我们看到了。DeepSeek 绝不是一个无关紧要的进展。要是哪天像 DeepSeek 这样的成果先在华为平台上出现,那对我们国家会是非常糟糕的结果。

帕特尔:为什么?因为目前像 DeepSeek 这样的模型如果是开源的,可以在任何加速器上跑。为什么将来会不是这样?

黄仁勋:假设它针对华为优化了且针对他们的架构优化了,那就会让我们的处于劣势。你描述了一种我认为是好消息的情况。一家公司开发了软件并开发了一个 AI 模型且在美国技术栈上跑得最好。我认为那是好消息。你把它作为前提说那是坏消息。我来告诉你真正的坏消息即世界上所有的 AI 模型都是在非美国硬件上开发的并且跑得最好。

帕特尔:我想我只是没看到证据表明存在巨大的差异会阻止你切换加速器。美国的实验室正在跨所有云且跨所有加速器跑他们的模型。

黄仁勋:我就是证据。你拿一个为英伟达优化的模型,然后试着在别的东西上跑。

帕特尔:但美国的实验室确实在那么做。

黄仁勋:而且它们跑得并不更好。英伟达的成功就是完美的证据。AI 模型是在我们的软件栈上创建的且在我们的软件栈上跑得最好,这怎么就不合逻辑了?

帕特尔:Anthropic 的模型在 GPU 上跑也在 Trainium 和 TPU 上跑。

黄仁勋:需要做很多工作才能改过来。但是去全球南方并去中东。开箱即用,如果所有 AI 模型都在别人的技术栈上跑得最好,那你现在就是在提出一个荒谬的主张说这对美国是好事。

帕特尔:但我不理解这个论点。假设中国公司先推出了下一个 Mythos。他们先在美国软件里发现所有安全漏洞,但他们可以在英伟达硬件上运行然后扩展到全球南方。这怎么会是好事?

黄仁勋:那不好。所以我们别让那发生。

帕特尔:你为什么认为这是完全可以替代的,如果你不给他们运算力,它就会被华为完全取代?他们是落后的对吧?他们的芯片比你差。

黄仁勋:现在有证据即他们的芯片产业巨大。

帕特尔:你可以直接比较一下 H200 和华为 910C 的 Flops、带宽或内存。华为那款大概只有 H200 的二分之一到三分之一。

黄仁勋:他们用更多的数量来弥补。

帕特尔:看来你的论点是他们有所有这些现成的能源对吧?他们需要用芯片来填充。

黄仁勋:而且他们擅长制造。

帕特尔:我相信最终他们也许能在制造上超过所有人。但眼下这几年很关键。

黄仁勋:你说的关键几年具体是哪些年?

帕特尔:就是接下来的几年。我们会拥有能发动各种网络攻击的模型。

黄仁勋:在那种情况下如果接下来的几年是关键,那么我们必须确保世界上所有的 AI 模型都是在美国技术栈上构建的。

帕特尔:如果它们是在美国技术栈上构建的,那又怎么防止它们如果它们拥有更先进的能力去发动等同于 Mythos 的网络攻击呢?

黄仁勋:无论如何都没有保证。

帕特尔:但如果你提早拥有它,我们可以为它做准备。

黄仁勋:听着你为什么要让 AI 产业的一层失去整个市场以便你能让另一层受益?有五层且每一层都必须成功。最需要成功的那一层是 AI 应用。你为什么如此执着于那个 AI 模型和那一家公司?为了什么?

帕特尔:因为这些模型实现了这些令人难以置信的攻击能力而且你需要算力来运行它们。

黄仁勋:能源、芯片和 AI 研究人员生态系统使它成为可能。

帕特尔:好我们退一步说。中国得自己建出足够的 7 纳米产能。别忘了他们现在还卡在 7 纳米,而你们会往 3 纳米、2 纳米、1.6 纳米走比如 Feynman 那一代。到时候你在用 1.6 纳米他们还在 7 纳米。他们只能靠数量来弥补单颗芯片的性能差距。而他们能源充足。你卖给他们越多芯片他们手里的总算力就越多。

黄仁勋:听着我只是觉得你的说法太绝对了。美国理应领先。美国的算力规模比世界上任何其他地方都高出 100 倍。美国理应领先。好吧美国现在就领先。英伟达打造的是最先进的技术。我们确保美国实验室最先知道这些技术并最先有机会购买。如果他们钱不够我们甚至会投资他们。美国理应领先。我们想尽一切办法确保美国领先。第一点你同意吗?我们确实正在这么做。

帕特尔:但如果他们的瓶颈是算力,把芯片运到中国怎么能让美国保持领先?

黄仁勋:不。我们有 Vera Rubin 给美国。Vera Rubin 是给美国的。现在我算不算美国的一部分?你把我算作美国的一部分吗?

帕特尔:算。

黄仁勋:那英伟达呢?你把英伟达算作一家美国公司对吧?第一为什么我们不能拿出一种更平衡的监管方式让英伟达能在全球取胜,而不是把全球市场拱手让掉?为什么要让美国把世界让出去?

芯片产业是美国生态系统的一部分,是美国技术领导力的一部分,是 AI 生态系统的一部分也是 AI 领导力的一部分。为什么你的政策和你的理念会导向让美国放弃全球市场中如此巨大的一块?

帕特尔:阿莫代伊曾引用过一句话,他说这就像波音吹嘘我们向敌对国家出售核弹但导弹外壳是波音制造的。这在某种程度上支持了美国技术栈。从根本上说你在给敌国这种能力。

黄仁勋:把 AI 和你刚才提到的那些东西相提并论是荒唐的。

帕特尔:但 AI 类似于浓缩铀对吧?它可以有积极用途也可以有消极用途。我们仍然不想把浓缩铀送到其他国家。

黄仁勋:这是一个糟糕的类比且一个不合逻辑的类比。

帕特尔:但是如果这些算力可以运行一个能对美国所有软件进行零日漏洞利用的模型,那它怎么就不是一种武器呢?

黄仁勋:首先解决这个问题的方法是与研究人员、与中国、与所有国家进行对话,确保人们不以那种方式使用技术。这是必须发生的对话。

第二点我们还需要确保美国领先,Vera Rubin、Blackwell 在美国大量供应并堆积如山。显然我们的结果会显示这一点。我们有大量的算力。我们这里有很棒的 AI 研究人员。

然而我们也必须认识到 AI 不仅仅是一个模型。AI 是一个五层蛋糕。AI 产业在每一层都很重要且我们希望美国在每一层都获胜包括芯片层。放弃整个市场不会让美国长期在芯片层、在计算堆栈中赢得技术竞赛,这就是事实。

帕特尔:我想关键问题是现在向中国卖芯片怎么能帮我们在长期获胜?你看特斯拉向中国卖了很久的电动汽车,iPhone 也在中国卖得很好。但这些并没有把中国锁定在美国的技术生态里。他们照样做出了自己的电动汽车且现在在全球占主导。智能手机也是一样。

黄仁勋:当我们今天开始对话时你承认英伟达的地位非常不同。你用了护城河这样的词。对我们公司来说最重要的事情是我们生态系统的丰富性,这关乎开发者。50%的 AI 开发者在中国。美国不应该放弃这一点。

帕特尔:但我们美国有很多英伟达开发者,这并不能阻止美国实验室将来也能够使用其他加速器。事实上现在他们也在使用其他加速器这很好。我不明白为什么在中国情况不会是这样,如果你向他们出售英伟达芯片就像谷歌可以使用 TPU 和英伟达一样。

黄仁勋:我们得持续创新。你可能也知道我们的份额在增长而不是在缩小。你刚才隐含了一个前提即就算我们在中国市场竞争也迟早会输掉。我不是那种一醒来就觉得自己会输的人。这种输家心态和输家前提对我来说毫无意义。

我们不是在造汽车。汽车今天买这个品牌明天换另一个很容易。计算不是这样。x86 能活到今天是有原因的且 ARM 那么有粘性也是有原因的。这些生态系统很难替代。换掉它们需要花大量时间和精力且大多数人根本不愿意这么做。所以我们的任务就是继续培育这个生态系统并不断推进技术,这样我们才能在市场上竞争。

你基于迟早会输这个前提就说我们应该放弃一个市场。我无法认同这种逻辑。这没有道理。我不认为美国是输家。我们这个行业不是输家。

关键是你走向了极端。你的论点从极端开始认为如果我们在关键时刻给他们任何算力我们就会失去一切这很幼稚。

帕特尔:让我为自己阐述一下我的论点。我的想法不是说存在某个关键的计算阈值而是任何边际算力都是有帮助的。所以如果你有更多的算力你可以训练一个更好的模型。

黄仁勋:我只想让你承认对美国技术产业的任何边际销售都是有益的。

帕特尔:如果跑在这些芯片上的 AI 模型具备网络攻击能力,或者这些芯片被用来训练这类模型并运行更多攻击实例,那它虽然不是核武器但确实启用了一种武器。

黄仁勋:按你这个逻辑你不如把它用到微处理器和 DRAM 上。你甚至可以用到电上。

帕特尔:但事实上我们确实对制造最先进 DRAM 的相关技术实施了出口管制。我们对中国制造芯片的各种东西都有各种出口管制。

黄仁勋:我们向中国销售大量的 DRAM 和 CPU 且我认为这是正确的。

帕特尔:我想这回到了根本问题即 AI 是否不同?如果你拥有那种能在软件中发现零日漏洞的技术,我们是否希望最大限度地减少中国首先达到并广泛部署它的能力?

黄仁勋:我们希望美国领先且我们可以控制这一点。

帕特尔:如果芯片已经在那里且他们正用它们来训练那个模型我们如何控制?

黄仁勋:我们有大量的算力。我们有大量的 AI 研究人员。我们在尽可能快地竞赛。

帕特尔:再说一次我们拥有的核武器比任何人都多但我们不想把浓缩铀送到任何地方。

黄仁勋:我们不是浓缩铀且它是一个芯片而且是一个他们可以自己制造的芯片。

帕特尔:但他们从你这里购买是有原因的。我们有中国公司创始人的引言说他们受限于算力。

黄仁勋:因为我们的芯片更好。总的来说我们的芯片更好。这是毫无疑问的。如果没有我们的芯片你能承认华为经历了创纪录的一年吗?你能承认一大批芯片公司已经上市了吗?你能承认吗?

帕特尔:能。

黄仁勋:你能否也承认我们曾经在那个市场拥有非常大的份额而我们现在不再拥有大份额?我们也可以承认中国约占世界技术产业的 40%。为美国技术产业放弃这个市场对我们的国家是一种伤害。对我们的国家安全是一种伤害且对我们的技术领先地位是一种伤害,这一切都为了一个公司的利益。这对我来说毫无意义。

帕特尔:我想我有点困惑,感觉你在说两种不同的陈述。一是如果我们被允许竞争我们将赢得与华为的竞争因为我们的芯片会好得多。二是没有我们他们也会做完全相同的事情。这两件事怎么能同时进行呢?

黄仁勋:这显然是真的。在没有更好选择的情况下你会接受唯一的选择。这怎么不合逻辑了?这太合逻辑了。

帕特尔:他们想要英伟达芯片是因为它们更好?

黄仁勋:是的。

帕特尔:芯片更好意味着更多的算力且更多的算力意味着你可以训练更好的模型。

黄仁勋:我们的芯片更好不只是算力更高,还因为它更容易编程且我们有更好的生态系统。而且我们向中国卖芯片美国自己也在受益。我们维持了美国的技术领先地位且开发者继续在美国技术栈上工作。当这些 AI 模型扩散到全球时美国技术栈仍然是那个最适合运行它们的平台。这样我们就能持续推进和扩散美国技术。我认为这是好事也是美国技术领先地位中非常重要的一环。

现在你所倡导的政策导致美国电信行业基本上被政策排挤出世界,以至于我们不再控制自己的电信。我不认为那是明智的。这有点狭隘并且导致了我在向你描述的、你似乎很难理解的意外后果。

帕特尔:现在问题很清楚就是好处和成本哪个更大。我想让你承认一个潜在的成本。算力是训练强大模型的输入而强大模型确实有很强的攻击能力比如网络攻击。美国公司先达到 Mythos 那种能力水平然后暂缓发布,给美国公司和美国政府时间修补漏洞并加固软件这是好事。

但如果中国因为获得了更多算力而更早做出类似的模型并大规模部署,那会很糟糕。这件事到现在还没发生一个关键原因就是美国公司包括英伟达拥有更多的算力。所以我们把芯片卖给中国就是在帮他们缩小这个差距。这是一个成本。先不谈好处你承不承认这确实是一个潜在的成本?

黄仁勋:那我也告诉你另一个潜在的成本。如果我们放弃中国市场即世界第二大市场,就等于把 AI 堆栈中最重要的一层也就是芯片层整个让了出去。他们会在自己的市场里发展规模并建立自己的生态系统。未来的 AI 模型会针对他们的技术栈做优化而他们的模型又是开放的。随着 AI 扩散到全球其他地方他们的标准和技术栈反而会变得比我们的更优越。

帕特尔:我想我只是足够相信英伟达的内核工程师和 CUDA 工程师,认为他们可以优化。

黄仁勋:AI 不仅仅是内核优化你知道的。

帕特尔:当然但你可以做很多事情比如从蒸馏到一个非常适合你芯片的模型。

黄仁勋:我们会尽力的。

帕特尔:你拥有所有的软件。很难想象即使他们在一段时间内有一个稍微更好的开源模型,会对中国生态系统产生长期锁定。

黄仁勋:中国现在是全球开源软件最大的贡献者也是开放模型最大的贡献者。而今天这些开源生态是建立在美国技术栈、建立在英伟达之上的。

AI 技术栈的五层都很重要且美国应该每一层都赢。当然最重要的是最上面的应用层,谁能把 AI 扩散到社会里用得最多谁就从这场工业革命里受益最大。但每一层都必须成功。

如果我们把这个国家吓住让所有人都觉得 AI 是核弹且所有人都讨厌 AI、害怕 AI,我不知道这对美国有什么好处。你这是在害美国。如果我们吓唬所有人让他们别去学软件工程说 AI 会消灭所有软件工程岗位,结果我们真的没了软件工程师那才是对美国最大的伤害。

如果我们吓唬所有人让他们别当放射科医生,说计算机视觉已经免费了且 AI 读片比人强,那我们是混淆了工作和任务。放射科医生的工作是照护病人而读片只是其中的一项任务。如果我们连这个都搞错了且吓得没人去读放射科,我们最后会缺放射科医生并缺好的医疗服务。

所以我说当你从一个极端前提出发把一切看成要么零要么无穷,最后就会用一种不真实的方式吓唬人。真实世界不是这样的。

我们希望美国第一吗?当然。我们需要 AI 技术栈的每一层都领先吗?当然。

你今天谈 Mythos 因为 Mythos 确实重要。但几年后当美国想把我们的技术栈、我们的技术推广到全世界比如到印度、中东、非洲、东南亚,当我们的国家想出口技术且想出口标准的时候,我希望到那时我们俩能再聊一次。到那天我会告诉你你今天设想的这些政策是如何让美国无缘无故地放弃了世界第二大市场的。

我们不应该主动放弃这个市场。如果竞争不过失去也就失去了但为什么要主动让出去?现在没人主张全有或全无,不是说我们要把所有东西都卖给中国。没人这么主张。

我们应该始终把最好的技术、最多的技术优先留在美国,并且让美国最先拥有。但与此同时我们也应该去全球各地竞争并赢下市场。这两件事可以同时做到。只是需要一些分寸、一些成熟而不是非黑即白。这个世界不是非黑即白的。

帕特尔:好关键在于这一点。他们会针对自己几年后能造出的最好芯片来优化模型。这些模型会被出口到世界各地从而形成标准。由于 EUV 出口管制正如我们所说你们将迈向 1.6 纳米。但即使几年后他们很可能仍然停留在 7 纳米。

在国内他们可能会说我们有这么多能源且可以大规模量产所以继续用 7 纳米也没问题。但在出口市场上他们的 7 纳米芯片要直接跟你们的 1.6 纳米芯片竞争。到那时候他们的模型必须针对 7 纳米做极其深度的优化,以至于在 7 纳米上跑他们的模型反而比在你们的 1.6 纳米上跑效果更好。

黄仁勋:我们能不能先看看事实?Blackwell 在光刻技术上比 Hopper 先进了 50 倍吗?差得远。我反复强调过摩尔定律已经死了。从 Hopper 到 Blackwell 单看晶体管姑且说提升了 75%吧而且中间隔了三年。但 Blackwell 比 Hopper 快 50 倍。

我的观点是架构很重要且计算机科学也很重要。半导体物理学当然重要但计算机科学同样重要。AI 的影响力主要来自整个计算堆栈,这就是为什么 CUDA 如此有效且如此受欢迎的原因。它是一个生态系统且一个计算架构并提供了极大的灵活性。你想彻底改变架构且搞出 MoE、搞出扩散模型、搞出分解式架构都能做到而且很容易做到。

事实是 AI 对上层堆栈的依赖程度不亚于下层架构。从这个角度说我们的架构和软件堆栈是针对我们自己的生态系统优化的这本身就是优势。正如我们刚对话时就谈到英伟达的生态系统有多丰富。为什么大家总是首选 CUDA 来编程?因为他们确实喜欢且中国的研究人员也一样。

但如果我们被迫离开中国这是一个政策错误,显然会适得其反且对美国不利。它会加速他们的芯片产业并迫使他们所有的 AI 生态系统专注于自己的内部架构。现在纠正还不算太晚但事情已经在发生了。

你将来会看到他们不会停留在 7 纳米这很明显。他们擅长制造且会从 7 纳米继续往前推进。那 5 纳米和 7 纳米之间有 10 倍的差距吗?答案是否定的。架构很重要且网络也很重要,这就是英伟达收购 Mellanox 的原因。能源也很重要。所有这些都很重要且事情并不像你说的那么简单。

英伟达为什么不制造多种不同的芯片架构?

帕特尔:我们之前讨论了台积电和内存等环节的瓶颈。如果未来我们处在这样一个局面即你已经占了 N3 节点的大部分产能且接下来会占 N2 的大部分,你会不会考虑回头用 N7 的闲置产能?比如说 AI 需求太大且领先节点的扩产跟不上,那你就用旧节点来造 Hopper 或 Ampere 但加上我们今天知道的数值格式改进和其他优化。你觉得 2030 年之前会发生这种事吗?

黄仁勋:没必要。因为每一代架构的提升不光是靠晶体管尺寸。我们在工程、封装、堆叠、数值格式、系统架构上做了大量工作。

产能不够的时候再回头去搞一个旧节点,那需要投入的研发成本没人负担得起。我们能负担的是往前走而不是往回走。当然如果有一天全球产能真的彻底到头了,问我愿不愿意回头用 7 纳米?我当然愿意。

帕特尔:有人跟我讨论过一个问题即英伟达为什么不并行做几个完全不同架构的芯片项目?比如像 Cerebras 那样的晶圆级芯片或者像 Dojo 那样的大封装甚至做一个不带 CUDA 的。你们有资源也有人才且可以同时做这些。既然 AI 和芯片架构的方向不确定为什么要把所有鸡蛋放在一个篮子里?

黄仁勋:我们可以做只是我们没有发现更好的方向。你说的那些我们都模拟过且结果证明它们不如现在的方案。所以我们不做。我们正在做的就是我们想做的。如果未来的工作负载发生根本性变化我不是指算法而是指实际的计算任务类型,这取决于市场的需求形态,我们可能会考虑增加其他类型的加速器。

比如最近我们纳入了 Groq 且会把它整合到 CUDA 生态里。原因在于 Token 的价值现在已经很高了且可以对 Token 实行差异化定价。几年前 Token 要么免费要么很便宜。现在不同客户有不同的需求且愿意为不同的答案付不同的钱。比如我们的软件工程师如果能给他们响应更快的 Token 让他们效率更高,我愿意为此多付钱。

但这个市场是最近才出现的。所以我们决定扩展帕累托前沿并做一个响应更快但吞吐量更低的推理细分市场。以前吞吐量高就是更好,但现在我们认为可能存在一个高 ASP(平均售价)Token 的市场即使工厂的总吞吐量下降更高的单价也能弥补。这就是我们做这件事的原因。除此之外如果我有更多的钱我还是会投到英伟达现有的架构上。

帕特尔:这种高端 Token 和推理市场细分的想法很有意思。假设深度学习革命没有发生英伟达现在在做什么?

黄仁勋:加速计算且我们一直在做这个。我们公司的基本判断是通用计算的扩展能力基本到头了。

所以我们把 GPU 和 CUDA 跟 CPU 结合起来,把 CPU 上的某些工作负载卸载到 GPU 上加速。这样可以把一个应用提速 100 倍甚至 200 倍。这些应用可以是工程、科学、物理、数据处理、计算机图形、图像生成等等。即使没有 AI,英伟达也会是一家非常大的公司。

原因很简单即通用计算继续扩展的路基本走完了且出路在于特定领域的加速。我们起步于计算机图形但还有很多其他领域涵盖粒子物理、流体、结构化数据处理等等都能从 CUDA 受益。我们的使命就是把加速计算带给世界并推进那些通用计算做不了的应用,帮助突破某些科学领域。早期的应用包括分子动力学、能源勘探的地震数据处理、图像处理等等。

如果没有 AI 我会很难过。但正因为我们在计算上取得的进步,我们让深度学习变得普及了。任何研究人员、科学家、学生都能用一台 PC 或一张 GeForce 显卡做很厉害的科学。这个基本承诺一点都没变。

你看 GTC 大会开头那部分跟 AI 一点关系都没有,包括计算光刻、量子化学、数据处理。这些工作依然非常重要。我知道 AI 很让人兴奋但还有很多人做着非常重要且跟 AI 无关的工作。张量不是唯一的计算方式。我们想帮助所有人。

帕特尔:非常感谢。

黄仁勋:不客气。我很享受与你的对话。

帕特尔:我也是。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

Techub News的精选文章

7小时前
FBI 2025 互联网犯罪报告解读:损失突破 208 亿美元,AI 驱动诈骗日趋严峻
7小时前
为何 All-in 海外 KOC:一场关于 AI 时代窗口期的豪赌
7小时前
高盛教你收租:从备兑看涨到牛熊双吃,比特币的现金流秘籍
查看更多

目录

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

相关文章

avatar
avatarOdaily星球日报
4小时前
BitFuFu携S21 XP在架矿机亮相Bitcoin 2026,售价低至每太算力9.5美元
avatar
avatarOdaily星球日报
7小时前
从「飞轮」到「镰刀」:26岁Believe创始人因加密欺诈面临刑事指控
avatar
avatarOdaily星球日报
7小时前
不卖鞋了卖算力,AI算力会重蹈DAT覆辙吗?
avatar
avatarTechub News
7小时前
FBI 2025 互联网犯罪报告解读:损失突破 208 亿美元,AI 驱动诈骗日趋严峻
avatar
avatarTechub News
7小时前
为何 All-in 海外 KOC:一场关于 AI 时代窗口期的豪赌
APP下载
Windows
Mac

X

Telegram

Facebook

Reddit

复制链接