英伟达要削减AI芯片的内存?黄仁勋:使用要明智巧妙,争取更多供应

  黄仁勋否认了公司芯片将削减高带宽内存(HBM)用量的传言。

  6 月 5 日,英伟达 CEO 黄仁勋在韩国接受外媒采访时,当被问及“英伟达将因供应紧张而削减 HBM 用量”的传言,黄仁勋明确回应称:“我们将使用大量的 HBM 内存。当然,目前供应确实受限。因此,我们需要在所有系统中更加明智地使用内存。我们将继续与这里的合作伙伴合作,以争取尽可能多的供应,并尽可能巧妙地运用。”

  在供应商方面,黄仁勋确认,三家内存供应商(三星电子、SK 海力士和美光科技)将为采用英伟达最新 AI 芯片提供 HBM4,他们均已通过资格认证并投入量产,“都在竞相支持公司的 Vera Rubin 架构”。此前,黄仁勋表示,Vera Rubin 芯片已全面投产,预计将于今年第三季度交付。

  黄仁勋的本次回应可谓是非常及时。就在 6 月 4 日,研究机构 SemiAnalysis 发布文章称,英伟达下一代旗舰级超算机架 Vera Rubin NVL72 的 SOCAMM DRAM(一种专门为 AI 服务器打造的新型内存模块标准)容量可能从此前预期的约 55TB 降到约 28TB。同时,多数 Rubin 系统将采用 96GB SOCAMM 模块,而非此前市场预期的 192GB。

  消息传出后,一些观点认为,英伟达开始因内存短缺而削减其用量。再加上定制 AI 芯片(ASIC)巨头博通在同一天发布的财报未能支撑起投资者过高的期待,全球存储概念迎来回调。

  4 日当天,美光科技(Nasdaq:MU)盘中一度暴跌超 10%,单日蒸发超千亿美元市值。6 月 5 日,韩国股市也迎来剧烈调整,半导体巨头股价惨遭重挫。截至当天收盘,SK 海力士跌 9.92%,三星电子跌 6.4%。

  不过,有分析指出,如果仔细阅读 SemiAnalysis 的报告,可以看到,内存的主要变化来自采用 LPDDR5X 内存的 CPU。每个 Vera Rubin NVL72 机架搭载了 72 颗 Rubin GPU 和 36 颗 Vera CPU,每颗 GPU 采用 288GB 的 HBM4 内存,整机架约 20.7TB,这部分并没有发生改变。

  同时,由于 SOCAMM 是插槽式设计,随时可以被更换为更高的内存。也就是说,只是在 Vera Rubin NVL72 的出货配置中,CPU 的初始内存容量被降低了。

  SemiAnalysis 的创始人 Dylan Patel 也在X(原推特)平台上发言称:“我很喜欢一件事,就是那些转发我们报告的人,把报告里的大部分内容都漏掉了。这种事经常发生。”

  在本次采访中,黄仁勋还谈到,他在此次韩国之行中安排了和现代汽车、LG、SK 海力士、三星电子及韩国互联网巨头 NAVER 的相关会面,核心目的是确保供应链合作伙伴“保持步调一致并做好充分准备”。他称自己为韩国“带来了庞大的业务”,并暗示另有惊喜尚待公布。