
新智元报道
编辑:桃子
老黄深夜祭出最强挑衅:所有自研芯片都是「纸老虎」!他直言谷歌 TPU、亚马逊 Trainium 根本不敢上台打擂,并首次揭秘了英伟达从「电子到 Token」的终极护城河。
自研芯片全是「纸老虎」!
在最新访谈中,英伟达 CEO 甩出了一句极其挑衅的宣言——
谷歌 TPU 没来,亚马逊 Trainium 没来,根本没一个敢露面。

直白讲,在 AI 算力的终极对决赛中,除了英伟达,能打的对手还没出现!
在近两小时播客中,老黄与主持人 Dwarkesh Patel 展开了一场极具火药味且深度的对话。
他不仅重申了英伟达的技术护城河,更对当前的全球竞争格局,表达了冷峻的预判。

访谈中,最震撼人的一个镜头是——
面对别人的质疑,老黄霸气外露地回怼道,「我醒来从没觉得自己是个 loser」。
「我们又不是一辆汽车(We are not a car)」。


近两小时对谈中,所有的精彩亮点如下:
-
公开叫阵 TPU、Trainium 上 MLPerf 打擂,至今无人应战;
-
抛出新思维模型:输入电子、输出 token,中间层就是英伟达;
-
英伟达拥有全球最低的 TCO,在同等能耗下,token 产出效率世界第一;
-
罕见认错,低估了 Anthropic 这步棋。但 Anthropic 只是特例,全世界只有一个;
-
真正卡脖子的不是 EUV 光刻机,是水管工和电工。

把「电子」转化成 token
这就是护城河
访谈一开场,Dwarkesh 瞄准了英伟达护城河,提出了一个尖锐的问题——
既然英伟达本质上是设计软件,然后交给台积电代工、由海力士提供内存,那么如果未来 AI 让软件变得像大宗商品一样廉价,英伟达的估值是否也会崩塌?
对此,老黄提出了一个全新的「思维模型」。
输入的是电子,输出的是 token,而中间层就是英伟达

他认为,制造一个 token 就像制造一个分子,如何让这一个 token 比另一个 token 更有价值,背后蕴含着极其高深的艺术、工程与科学。
而这种「电子到 token」的转化过程极其复杂,很难被平庸化。
最重要的是,英伟达的护城河在于「五层蛋糕」生态系统,他们坚持做尽可能少、但在必须做的领域做到极难的策略。

而对于「英伟达靠锁定稀缺供应链建立护城河」的说法,老黄承认,这确实是对手难以企及的优势。
他特别强调,这种优势源于一种「前瞻性的结盟」,具体怎么讲?
-
合作之前,AI 蓝图早就绘好了
英伟达不仅仅是砸钱买产能,更是在几年前就开始说服台积电、美光等公司的 CEO,向他们描绘 AI 产业未来的规模。
-
GTC,就是一场大型「教育会」
老黄调侃道,自己的 GTC 演讲更像是「教育」,他必须让整个供应链看清未来的趋势,才能引导全球的资源向 AI 产业倾斜。

所谓的「瓶颈」,都是暂时的
当谈到逻辑芯片、CoWoS 封装、HBM 内存的紧缺,是否会限制 AI 的增速时,老黄表现得非常淡定。
他指出,在巨大的市场需求信号面前,任何硬件瓶颈通常只需2-3 年就能通过大规模扩产解决。

英伟达已在「预取」(Prefetching)未来的瓶颈,技术授权是一部分,另一种方式就是「投钱」。
比如,帮助合作伙伴 Lumentum、台积电提前布局硅光子、双面探测等前沿技术。
有趣的是,老黄认为真正的长久挑战往往在更下游:
- 能源:无论是重工业化还是建设 AI 工厂,能源政策的滞后才是长期难题;
- 劳动力:真正的稀缺资源不是 EUV 光刻机,而是能落地 AI 数据中心的「水管工和电工」。

这里再 mark 一下 Hinton 那句话,去做水管工
喊话谷歌 TPU 来战,没人打赢英伟达
接下来,才是整场访谈中最刺激的一部分。
Dwarkesh 提出了一个令市场不安的观察:
目前全球最顶尖的三个 AI 模型中,其中两个(Claude 和 Gemini)是在谷歌 TPU 上训练的。
这是否意味着,英伟达 GPU 并非不可替代?
老黄对此进行了强有力的反击,他认为完全是「降维打击」,并把英伟达的成功归结为一种完全不同的计算范式。
「加速计算」降维打击
TPU 只是一个「张量处理单元」,英文带做的是「加速计算」。
「加速计算」的应用范围远超 AI,涵盖了分子动力学、量子色动力学、流体力学、粒子物理以及大规模数据处理。
如今,AI 算法演进极快。

如果明天出现一种新架构,高度可编程的 CUDA 可以无缝支持,而固化的 ASIC 芯片可能直接变成「电子垃圾」。
虽然矩阵乘法是 AI 的核心,但创新的关键在于——快速发明新内核。
老黄透露,Blackwell 之所以比 Hopper 飙升 50 倍性能,靠的是通过 CUDA 对 MoE 等新架构,进行的深度底层协同设计。
他将 CUDA 比作英伟达最宝贵的资产——
全球有数亿颗英伟达 GPU,分布在所有主流云平台和边缘设备中。
开发者写出的代码,可以「一次编写,到处运行」。
他将 CPU 比作凯迪拉克,人人都能开得不错;而英伟达的加速器则是 F1 赛车。


虽然普通人能开到 100 码,但只有英伟达的专家能将其性能推向极限,帮助客户通过优化软件栈直接获得2-3 倍的性能提升。
TCO 经济学,token 产出最多
面对「大客户是否会为了省钱而自研芯片」的质疑,老黄给出了一组非常硬核的商业逻辑:
英伟达的计算栈是全球「总拥有成本」(TCO)最低的,没有之一。

在同样的 1GW 数据中心里,使用英伟达架构产出的 token 数量,是全球最高的。
现场,老黄直接公开叫阵,欢迎 Trainium、或 TPU 参加像 InferenceMAX 或 MLPerf 这样的第三方基准测试。
但实际上,没有人愿意「露面」。

很多人抱怨英伟达 70% 的利润率太高,但老黄一针见血地指出,即便是找博通代工 ASIC 芯片,对方也要赚走 65% 的利润。
为了省那5% 的利润,而放弃整个生态系统的兼容性,这在商业逻辑上是讲不通的。
Anthropic 只是一个特例,并非趋势
Dwarkesh 追问,既然英伟达这么好,为什么 Anthropic 还是选择了与谷歌、亚马逊签下数十亿美元的 TPU 订单?

面对如此尖锐的问题,老黄又是如何自圆其说?
他用一句话总结:Anthropic 只是一个特例,并非趋势。


紧接着,他表示,如果没有 Anthropic,TPU、Trainium 的增长无从谈起,100% 是 Anthropic 带来的。
但世界上只有一家 Anthropic!

与此同时,老黄罕见地承认了策略上的失误:
当时,谷歌和亚马逊通过巨额融资,换取了 Anthropic 使用其自研算力的承诺。
我当时的错误在于,没有深刻意识到,如果不给这些实验室提供资金支持,他们别无选择。
英伟达的商业「哲学」:不越界
访谈的后半段,Dwarkesh 又提出了一个极具诱惑力的假设——
既然英伟达拥有无可匹敌的算力资源,为什么不直接下场成为一家超大规模云服务商(Hyperscaler)?
老黄的回答揭示了英伟达的商业哲学:「做尽可能多,同时也做尽可能少」。

世界上已经有很多云服务商了。
如果英伟达自己下场做云,就是与自己的客户(亚马逊、微软等)直接竞争。
英伟达宁愿选择投资像 CoreWeave 这样的「原生 AI 云」,通过背书和资金支持,让生态系统更加多元化,而不是亲自去盖机房、拉电线。
老黄认为,一个健康的公司应当专注于那些「如果我不做,就没人能做成」的事情。
如果英伟达不去研发 NVLink、不投入 20 年时间在亏损中坚持 CUDA、不开发像 cuLitho 这种计算光刻库,这些技术可能永远不会出现。

投资,但不「选妃」
近来,英伟达对 OpenAI、Anthropic 进行了规模惊人的投资,分别达 300 亿和 100 亿美金规模。
对此,老黄非常严肃地表示,「我们不选赢家」。
一方面,这不是我们的工作,另一方面,我深知创业的不确定性。


他回忆起英伟达初创时,全球有 60 家图形芯片公司,而英伟达当时甚至是架构最「离谱」的一个。
英伟达的策略是——
如果世界需要这些伟大的 AI 公司存在,而 VC 无法提供百亿级别的资金支撑,那么英伟达就会出手。
但目的是为了让整个生态「繁荣」,而不是为了控制它们。

做好一件事,CUDA 就够了
在访谈的尾声,Dwarkesh 提出了一个具有思辨性的问题:
英伟达现在财大气粗,人才济济,为什么不并行开发几种完全不同的架构?
比如像 Cerebras 那样的晶圆级芯片,或者像特斯拉 Dojo 那样的「巨型封装」,以防万一 AI 架构发生突变。
老黄的回答,展现了他作为顶级架构师的极度自信与理性。
模拟器已否定了一切
他直言,英伟达拥有世界顶尖的「模拟系统」。
我们可以在模拟器里,模拟出你能想象到的任何架构。结果证明,那些方案在性能和效率上都更糟。
也就是说,从数据上的验证已经否定了这一切。

Dwarkesh 又问道,如果台积电先进制程(如 N2/N3)产能见顶,英伟达是否会回到老旧的 N7 工艺重新设计 Hopper?
对此,老黄表示,这种「回流」研发的成本高得离谱。
英伟达宁愿选择在先进制程上「倾力向前」,通过先进封装和数值计算的改进来弥补产能压力。
扩产 Groq:抢占「溢价 token」市场
众所周知,英伟达几个月前将「推理芯片之王」Groq 纳入了 CUDA 生态。
这背后,蕴含着老黄对推理市场「分层化」的深刻洞察:
以前 token 要么免费,要么极便宜。
但现在,如果更快的响应速度,能让一名年薪几十万美金的软件工程师效率翻倍,那么企业愿意支付极高的溢价。

过去英伟达追求的是高吞吐量(单位时间内产出的 token 总量),但现在他们开始布局「低延迟、高溢价」的推理细分市场。
这意味着未来英伟达的工厂将同时产出「平价高产」和「尊享速达」两种 token。
如果没有 AI 革命,英伟达会怎样?
访谈以一个浪漫的假设结束。如果深度学习革命从未发生,英伟达现在会在做什么?
老黄语气中带着一种使命感:「即便没有 AI,英伟达也会非常庞大」。

-
通用计算的终结
他的基本信念是,「摩尔定律」下的通用计算(CPU)已经走到了尽头。
无论有没有 AI,科学、工程、物理、图像处理这些领域,都急需「加速计算」。
-
科学的民主化
英伟达的初心是让每一位学生、每一位科学家,通过一张 GeForce 显卡就能处理分子动力学或地震数据。
这种「加速计算」的底色,其实早在 AI 爆发前就已经涂就。
-
不仅仅是张量
老黄强调,在 GTC 演讲的开篇,他总会花大量时间讲计算光刻(cuLitho)、量子化学和数据处理。
AI 确实令人兴奋,但这个世界上还有很多重要工作与 AI 无关,张量并不是计算的唯一方式。我们想帮助每一个人。

参考资料:
https://www.dwarkesh.com/p/jensen-huang
https://x.com/dwarkesh_sp/status/2044456498441708013?s=20
https://www.youtube.com/watch?v=Hrbq66XqtCo
