国思软件 - “阉割版”AI芯片，也能让英伟达赚疯？

　　出品虎嗅科技组

　　作者丸都山

　　编辑苗正卿

　　头图视觉中国

　　本文为《进击的 AI 巨头》系列第 001 篇文章，《进击的 AI 巨头》聚焦头部 AI 公司的最新动向，我们将持续追踪这些正在影响 AI 未来走向的核心参与者。本文聚焦于英伟达发布的 H20 GPU 芯片。

　　一枚性能大幅缩水 AI 芯片，可能会让英伟达在中国挣上 900 亿。

　　7 月 5 日，咨询机构 SemiAnalysis 发布报告称，英伟达在今年有望交付 100 万枚 H20 GPU。

　　考虑到这是一枚阉割过，且性价比较低的“对华特供版”芯片，基本可以认定，这 100 万枚芯片将在今年全部流入中国大陆市场。以目前该型芯片 1.2-1.3 万美元的渠道定价来看，H20 芯片可以为英伟达带来至少 120 亿美元的收入，已经超过了这家公司去年在华总营收。

　　不过，H20 在中国市场的实际情况，可能并没有如咨询机构预估的那般乐观。

　　一位服务器经销商向虎嗅表示，目前一台 H20 八卡服务器，定价大约在 120 万元，而性能大幅领先的满配 H100 NVLink 版本的八卡服务器价格为 270 万元上下，而且是现货。

　　尽管后者早早被列入禁止对华出售的名单中，但在非官方渠道中，这款芯片的货源基本没有断过，甚至在今年二季度 H200 开售后，这款芯片的价格还下跌了约 10%。

　　“无论怎么看，H20 的性价比都还是太低。”这位服务器经销商提到，即便是同国内的解决方案相比，H20 都难言有多大的竞争优势。

　　“阉割版”，但还挺良心的？

　　与同系列芯片不同，H20 是一枚“赶工”性质非常明显的产品。

　　在去年 10 月美国升级芯片禁令后，原本就被视为阉割版芯片的 A800/H800，甚至是消费级产品 RTX4090 都被纳入禁令的管制范围。

　　但仅在一个月后，就有台湾地区媒体报道称，英伟达向代工厂下了 H20 芯片的订单。

　　在如此短的时间内，英伟达不可能重新设计一款芯片，最大的可能是基于既有型号进行有针对性的调整。

　　比如新规中取消了将“互联带宽”作为限制芯片的识别参数，英伟达就将 H20 的 HBM3 显存容量拉高到 96Gb，使显存带宽提高到 4.0Tb/s；又比如新规新增了“性能密度”的限制，英伟达就向算力规格大砍一刀，使其理论性能仅为 296TFLOP，相当于 H100 芯片的 15%。

　　至于那些新规没有提到的，比如 PCIe Gen5 扩展卡、八路 HGX，英伟达全部保留了下来。值得一提的是，H20 还有非常高的卡间互联速度，其 NV Link 带宽达到 900Gb/s，很适合组建大规模集群。

　　但这些特征组合在一起，却形成了一个很尴尬的事实：在算力大幅削减的情况下，H20 的 BOM（综合硬件成本）很可能跟 H100 齐平，甚至高于后者。

　　原因在于，存储颗粒一直是高性能计算卡成本的“大头”，比如 H100 芯片中，HBM3 颗粒的采购就要占到 60% 左右，而在 H20 芯片上，英伟达又不得不为其配备更高规格的显存容量，以弥补算力不足的缺陷。

　　基本可以断定，H20 在英伟达高性能计算卡中，属于利润率最低的存在。相较于 1.2-1.3 万美元的售价，与它同成本的 H100 目前定价为 2.5-3 万美元。

　　从这个角度来看，H20 算是英伟达的一款良心产品了。

　　英伟达自然不甘心于让一款单品拉低公司整体的毛利表现，但自去年芯片禁令升级后，英伟达四季度在中国大陆的营收，从上一季度的 40.3 亿降低至 19.46 亿，其中国区数据中心营收占比也从 22% 滑落至8%，英伟达急需用一款产品去稳住在中国的市场份额。

　　H20 就是英伟达拿出的诚意之作，但还是那个问题，H20 的算力实在羸弱，这个硬伤无法被忽视。

　　华为或与之一战？

　　实际上，英伟达曾在今年 2 月进行过一次官方调价，在调价之前 H20 芯片的价格为 2.3 万美元，尽管英伟达表示降价的原因是“供货充足”，但如此大幅的价格调整，主要原因大概率还是销量没有达到预期。

　　“国内大厂基本不会考虑 H20 服务器，都是闭眼买 H100，而那些体量相对小的厂商也认为有点划不来。”

　　有服务器经销商向笔者算了一笔账，现在 H100 的服务器单机租赁费用大概是8-9 万元/月，而算力仅有前者六分之一的 H20 服务器价格为 120 万元上下，即便不考虑算力损耗的问题，厂商也需要购买 6 台 H20 服务器，才能与 H100 服务器相齐平。

　　这样一对比，H20 虽然是英伟达利润率最低的产品，但对于客户来说，实在称不上有性价比。

　　而对于英伟达来说，还有一个不可忽视的因素是国内同类型竞品，比如华为昇腾 910B。

　　与 H20 相比，910B 在单卡算力（FP16）上几乎相当于前者的一倍。相应地，910B 价格也要高于 H20，服务器经销商向笔者表示，目前 910B 的服务器价格已经超过 170 万元。

　　抛开价格，从实际表现来看，二者的竞争互有胜负手。910B 强在算力和能效比上，H20 则胜在软件生态与互联上。最直接的例子就是，H20 兼容所有的英伟达H系列卡，而且具备极高的访存能力，在搭建算力集群时，能够更好地避免算力损耗。

　　当然，这个集群规模是有上限的，比如各地筹划的“万P计算集群”，如果用 H20 搭建，那么 0.15P 单卡运算能力就意味着十万颗级别的 GPU，组网难度极大。

　　另外一个值得关注的问题是，英伟达与华为谁能更加稳定地供应产品？

　　此前，就有业内人士向笔者提到过，对于那些急于购买搭建算力中心的厂商来说，H20 可能是更现实的选择。

　　一方面，英伟达的软件生态更加成熟，厂商的适配工作量要小得多；另一方面，目前无论是政策还是资本方，都对于算力中心的芯片国产化率有一定要求，910B 的需求量非常大，相应地交付周期也比较长。

　　这一说法笔者也在服务器经销商处得到了验证，对方向笔者表示，“在英伟达调价前，行业内客户对于 910B 的咨询要远大于 H20，但现在也有客户对 H20 展现出了兴趣，因为有充足的现货。”

　　有趣的是，二者可能并不是完全意义上的竞争关系，因为有业内人士向笔者表示，在他所在的公司，910B 和 H20 被归为不同分级，在采购上并不冲突。

“阉割版”AI芯片，也能让英伟达赚疯？