买不起英伟达“特供”,中国创业者偏爱4090

  距离 A100、H100 被禁售已经过去一年半,如今英伟达对华售卖阉割版的难度却一再升高。

  近期,Jeffries 分析师表示,美国在 10 月会对半导体出口管制进行年度审查,届时“很可能”禁止英伟达 H20 向中国销售。而禁售的方式有三种可能:特定产品禁令、降低计算能力上限,以及限制内存容量。

  英伟达计划为中国推出新的特供版 AI 芯片,这个消息自黄仁勋 3 月官宣 Blackwell 后就没停过。目前主流的消息是,英伟达计划推出的是 B200 的“阉割版”B20。

  但远在中国的众多中小创业者们明白:不管是论价格,还是论获取难度,英伟达的最新款高端 AI 芯片也大概率最多与自己“云端相见”。

  AI 创业者 Jason 告诉字母榜(ID:wujicaijing),他的公司之前的方向是 AI 应用层,除了通过云服务租 A100 和 H100 的算力之外,本地部署的是 50 张英伟达 V100 芯片,以及英伟达 3090 显卡。

  这样的选择既是因为初创企业要追求性价比,压缩成本,也是因为做 AI 应用层的业务其实并不需要极高的算力。V100 是英伟达在 2017 年发布的计算卡,彼时 V100 八卡服务器官方售价是 102 万元。而 Jason 的 50 张 V100 是“900 元每张捡的”二手货,3090 显卡是以每张 5000 元的价格收来的。

  从 2022 年底开始,英伟达的最强大的芯片都因美国升级半导体出口管制而出口中国受阻,不管是 A100,还是 Blackwell 之前最强大的 H100,都无法在中国正规售卖。在那之后,美国针对高端芯片的出口管制越来越严格,英伟达从 A800、H800,到 H20、L20、L2,推出了一款又一款“中国特供版”芯片。

  对于大多数创业者来说,特供版不仅性能远不及“原版”,价格也令人望而却步。一位卖家告诉字母榜,H20 八卡服务器的售价在 130 万元左右。IT 时报曾报道,H20 的主要需求方还是百度、阿里、腾讯和字节等互联网大厂。

  Jason 称,H20 主要是拿来做推理,但是“用 H20 不如用 4090”,因为后者够用,而且 H20 作为商用芯片,“商用有折旧率,折价比较多,机房大概几年换一批,普遍不保值,比如 V100 当年卖几万,现在只能卖几千,也就五六年时间,如果不是 AI 潮,最多值 500。”

  不止一位业内人士向字母榜表示,自己偏好使用英伟达 RTX4090,这款 2022 年 10 月推出的旗舰产品原以游戏显卡为名问世,但也备受 AI 行业的青睐,同样也受到了美国芯片出口管制的影响。

  华兮云的英伟达 RTX4090 备货

  AI 超算供应商浙江华兮云科技有限公司也介绍称,“目前最好用的是 4090”,不过“也要看配置、组网、显卡”,很多客户的需求其实 4090 就能满足,而且性价比来看也比较好。该工作人员还补充称,本月公司就要上 100 台 4090。

  对于英伟达将在中国推出新特供产品、B200 的“阉割版”B20 的消息,Jason 不感到兴奋,直说“看性价比”,而华兮云方面表示也尚未在业内听到相关消息。

  此前路透社曾报道英伟达已经就 B20 有中国的浪潮信息展开合作,但后者已经回应称该消息不属实。

  A

  今年 3 月 19 日,黄仁勋在美国加州圣何塞 SAP 中心登台,主题演讲大开大合,名为《见证 AI 的变革时刻》。

  老黄很少吹牛,英伟达官宣新一代 Blackwell 架构,并推出芯片 B200 和超级芯片 GB200。“新核弹”是外界对英伟达新产品的形容,彼时刚升任英伟达研究经理的 Jim Fan 感慨摩尔定律已经按不住这家公司了。

  但来自苹果的一次实验探索,稍稍阻挡下了英伟达的前进步伐。黄仁勋或许已成为全世界最不期待 Apple 智能上线的人。

  北京时间 7 月 30 日,苹果发表了一篇技术论文,其中有这样一则信息:支撑 Apple 智能的两个 AI 模型,都是在谷歌的云端芯片上进行预训练的。

  一来,谷歌的自研芯片为 TPU 张量处理器,此前多用于谷歌内部使用,而不对外出售。此番却出手抢走了大客户。二来,苹果此前曾在 5 月被《华尔街日报》爆料,正在为其数据中心服务器开发自研芯片,如今没有用上自研芯片,却依然没有选择英伟达。这足以令英伟达有些尴尬。

  苹果“晾着”英伟达,是英伟达如今处境的一个缩影。英伟达的股价在今年前六个月上涨了 150%,然而在 7 月份接连暴跌,占市值下跌幅度最大的八次中的四次。

  此外,英伟达近期坏消息不断:被传新芯片 B200 将延迟三个月甚至更久才能交付;美国司法部针对其展开两项反垄断调查。

  与之相对的,是不断传出的“中国特供版”消息——据多家外媒报道,英伟达计划向中国推出 B200 的阉割版 B20。并且,英伟达还有可能会针对中国出售搭载最新芯片的服务器,以服务器来弥补特供芯片的性能。如果该消息属实,这将会是英伟达首次针对中国市场专门推出一款服务器产品。

  上述举措也表明,尽管面临重重阻碍,但英伟达不仅没有放弃,还为中国市场做出更大的努力。

  2022 年底 ChatGPT 掀起的 AI 浪潮已经翻涌了近两年,英伟达也从一家芯片巨头一跃成为全世界市值最高的公司之一。如今 AI 赛道逐渐回归理性,竞争对手也慢慢形成围剿之势,中国变成了英伟达越来越难舍弃的市场。

  B

  对于中国 AI 赛道上的大量中小初创企业来说,英伟达中国特供版芯片并非他们的关注重点。而对于特供版芯片的主要采买方——中国的大型互联网企业来说,选择英伟达也只是当下的最优解。

  英伟达在 2023 年 10 月推出了为中国量身定制的 HGX H20、L20 PCle、L2 PCle,其中 H20 是备受瞩目的“矮子里的将军”,阉割版里的最强款。然而,一个月之后,随着英伟达跳票、H20 推迟到次年第一季度交付的消息,使得不少企业转向国产芯片。

  彼时中国基金报报道,百度已经为 200 台服务器向华为订购了 1600 个昇腾 910B 芯片。周鸿祎不久后也在乌镇峰会上表示,360 采购了 1000 多个华为 AI 芯片,比百度还早。

  到了今年上半年,又传出企业观望、华为等国产厂商竞争,英伟达 H20 在华销售疲软的消息。5 月,传出 H20 下调价格的消息,原因指向两点,一点是 H100 不缺货并开始降价,H20 随之下调,另一点是华为昇腾 910B 与之竞争,且初始售价后者更有优势。

  下半年,H20 在中国的销售似乎迎来转机。前不久,芯片行业咨询公司 SemiAnalysis 预测,H20 芯片有望在当前财年提振该公司中国区业绩,今年有望交付超过 100 万张 H20 芯片。按照单芯片 1.2 万美元到 1.3 万美元的售价计算,仅 H20 就可以为英伟达贡献超过 120 亿美元的营收,这个数字超过上一财年英伟达中国区的整体营收。IT 时报的报道指出,H20 的销售抬头,主要是因为英伟达的生态优势,以及华为昇腾 910B 供货紧张。

  这对英伟达来说,只能算作短暂的快乐,因生态优势和竞对供应紧张而获得的转机并不能言稳固。下一代“中国特供版”芯片很有可能在路上,但英伟达的挑战颇多。

  除了传言中可能推出的 B200 的“阉割版”B20 之外,据 The Information 报道,英伟达还计划为中国新版特供芯片搭配服务器。在中国专门推出一款服务器,这个动作英伟达此前未曾有过,此举是为了以服务器让特供芯片性能表现最大化,弥补“阉割版”的不足。

  以搭载服务器当“一揽子”方案的消息如果为真,将是英伟达在禁售束缚之下做的新尝试。

  坏消息是,市场再次传出英伟达最新芯片交付推迟的消息。据 The Information 近日的报道,英伟达已经向客户表示,B200 将延迟发布三个月或更长时间,批量出货时间或将延迟到明年的第一季度(原计划今年 10 月就开始批量生产)。

  此处提到的“客户”中不乏科技巨头,据报道,Meta 已经定下价值至少 100 亿美元的订单,微软也在近几周内将其订单规模增加 20%,并计划在明年第一季度前为 OpenAI 准备好 5.5 万到 6.5 万个 GB200。

  有理由怀疑,B200 的延迟交付也将影响英伟达向中国市场推出阉割版的节奏。报道中称延迟交付的原因是在生产时发现了“设计缺陷”。

  C

  虽然英伟达尚未证实推出 B20 的消息,但几乎不会有人怀疑这将会发生。

  比起 2022 年英伟达初次受到 AI 芯片的出口禁令,如今这家芯片巨头更加难舍中国市场。

  中国庞大的芯片需求自然是首要驱动力。2022 财年和 2023 财年,中国内地及香港地区分别为英伟达贡献 71.11 亿美元、57.85 亿美元的营收,分别占其总营收的 31.7% 和 25.9%。

  然而,由于美国的芯片禁令,英伟达在中国却面临失速风险。2024 财年,英伟达包含内地和港澳地区的中国市场营收止步百亿美元,占比滑至 16.9%。

  今年 5 月,英伟达发布 2025 财年第一季度(截至 2024 年 4 月 28 日)的业绩报告,在数据中心业务上,英伟达来自中国客户的营收占比已经从 2023 财年的 19%,降低至 2024 财年的中个位数百分比(5%)。

  对于中国本土芯片制造商发起的竞争,黄仁勋也心知肚明:“我们在中国的业务确实比过去的水平下滑很多。由于技术限制,现在在中国的竞争更加激烈。这些都是事实。”几天之后,黄仁勋再提中国芯片企业,称中国有很多 GPU 初创企业,不要低估中国在芯片领域的追赶能力。

  从某种角度来看,美国的芯片禁售令虽然给中国 AI 企业在这波浪潮之中增加了难度,但同时也为中国本土的芯片制造商提供了发展的空间。从黄仁勋的角度来看,这无疑是危险的,时钟滴答响,留给英伟达在“阉割”之中破局的时间不多了。

  这还不是英伟达更加难舍中国市场的全部因素。相比于 2022 年底,ChatGPT 掀起千模大战,英伟达销售额和股价齐飞冲天,如今英伟达正在面临越来越不确定的局面。

  仅在今年,就有 OpenAI 的 CEO 山姆·奥特曼(Sam Altman)7 万亿芯片网络野心被爆料,微软开发类似英伟达网卡 ConnectX-7 的替代品,想提高其自研芯片 Maia 的性能。而谷歌 TPU 创造者乔纳森·罗斯(Jonathan Ross)创办的技术公司 Groq,则叫嚣其新产品可以威胁到英伟达。

  苹果投向谷歌的怀抱则是英伟达的噩梦又向前了一步:在自研芯片之外,一家财力雄厚的科技巨头加入 AI 之战,却没有选择英伟达。

  在竞争之外,英伟达还面临着越来越强烈的监管压力。先是 7 月法国竞争管理局证实,正在对英伟达疑似违反市场竞争的行为进行调查。紧接着,8 月,美国司法部针对英伟达展开两项反垄断调查。

  英伟达的股价在今年前六个月上涨了 150%,然而美联储降息落后,华尔街也对于科技股施加重压,多重因素影响下,英伟达股价“终于”在 7 月份接连暴跌,占市值下跌幅度最大的八次中的四次。

  在这种情况下,英伟达需要,也必须保住在中国市场的影响力。这波 AI 浪潮虽然热闹,如今前路却也迷雾重重,英伟达是否会摸到天花板,甚至应了“AI 泡沫论”的“诅咒”跌落神坛,谁都说不准。

  在整整四年前,2020 年 8 月,英伟达公布 2021 财年第二季度财报,季度数据中心的收入才首次超过游戏业务。如今,数据中心已经取代游戏,成为英伟达的核心业务。但这一步,黄仁勋铺垫了多年。

  如今的英伟达,也同样需要为未来做打算,既要保持信心,也得“留一手”。一个有意思的数据是,据英伟达 2025 财年第一季度财报,该季度汽车业务在总营收中占比仅有 1.2%,却是英伟达在数据中心业务之外,唯一实现环比增长的业务。而在英伟达官方公布的汽车业务合作伙伴中,中国车企与智驾方案供应商占比超过 80%。

  从这个角度来看,中国特供 AI 芯片的意义也许并不仅仅在 AI,还在于英伟达需要在中国拥有持续的、可作为未来支点的影响力,哪怕是面临一次次被阉割的命运。

  参考资料:

  硅基研究室:《中国大陆营收占比暴跌,美国芯片禁令“刺伤”英伟达》

  赛博汽车:《感谢中国车企,英伟达缓过来了》

  钛媒体:《英伟达“过山车”式股价背后,AI 芯片巨头地位并非不可动摇》

  IT 时报:《性能“阉割”的英伟达 H20 为何会大卖?》

  半导体行业观察:《3 万亿芯片公司,也在夹缝求生?》