挑战英伟达,AMD官宣年更芯片!新款MI325X重磅发布,比H200快1.3倍

  新智元报道

  编辑:庸庸乔杨

  AMD 在 Computex 主题演讲上大出风头,推出了首批 Zen 5 处理器,包括台式机用 Ryzen 9000 CPU 和笔记本电脑用 Ryzen AI 300「Strix Point 」APU。除此之外,AMD 还宣布了芯片年更计划以及备受期待的第五代 EPYC Turin 处理器。

  昨天,老黄在 Computex 上的演讲再一次让英伟达成为全世界的焦点,而同在芯片产业的 AMD 也不甘落后,推出了更强大的产品组合,全面进军 AI PC 领域。

  芯片年更,与领头羊英伟达一较高下

  自去年以来,英伟达向投资者明确表示,计划将发布周期缩短为每年一次,现在 AMD 也紧随其后,开始芯片年更。

  首席执行官苏姿丰(Lisa Su)表示「每年都有这样的节奏,是因为市场需要更新的产品和能力...... 我们每年都会有下一个大事件,这样我们就始终拥有最具竞争力的产品组合。」

  她详细介绍了该公司未来两年开发人工智能芯片的计划,以挑战行业领导者英伟达。

  最新的 MI325X 加速器将于 2024 年第四季度上市。

  即将推出的名为 MI350 的芯片系列,预计将于 2025 年上市,并将基于新的芯片架构。与现有的 MI300 系列人工智能芯片相比,MI350 在推理方面的性能预计将提高 35 倍。

  2026 年,MI400 系列将会被推出,该系列将基于名为「Next」的架构。

  如此这般,AMD 和英伟达「你方唱罢我登场」,两者之间的较量充满了刀光剑影。

  开发生成式人工智能程序的竞赛催生了人工智能数据中心的发展,而支撑数据中心的就是这些先进芯片。

  AMD 一直是英伟达的竞争者,后者目前主导着利润丰厚的人工智能半导体市场,占据了约 80% 的份额。

  现在,为了追赶英伟达,AMD 更加孤注一掷,「人工智能显然是我们公司的头等大事,我们确实利用了公司内部所有的开发能力来实现这一点。」

  先不管芯片表现如何,AMD 此举也是为了吸引投资者的关注。

  在华尔街「铲子」交易中投入了数十亿美元的投资者一直在寻求芯片公司的长期更新,因为他们要评估生成式 AI 蓬勃发展的持久性,而这一趋势迄今为止还没有放缓的迹象。

  自 2023 年初以来,AMD 股价已上涨一倍多。与同期英伟达股价七倍多的涨幅相比,这一涨幅仍然相形见绌。

  苏姿丰在 4 月份表示,AMD 预计 2024 年 AI 芯片销售额约为 40 亿美元,比之前的估计增加了 5 亿美元。

  在 Computex 活动上,AMD 还表示其最新一代中央处理器单元(CPU)可能会在 2024 年下半年上市。

  虽然企业一般会优先考虑在数据中心中使用人工智能芯片,但 AMD 的部分 CPU 也会与 GPU 结合使用,不过两者的比例更倾向于 GPU。

  AMD 详细介绍了其新型神经处理单元(NPU)的架构,专门用于处理 AI PC 中的设备端 AI 任务。

  随着个人电脑市场走出长达数年的低谷,芯片制造商们一直寄希望于人工智能功能的增强来推动个人电脑市场的增长。

  惠普和联想等个人电脑供应商将发布包含 AMD AI PC 芯片的设备。AMD 还放出话来,他们的处理器已经超过了微软对 Copilot+PC 的硬件要求。

  3nm EPYC Turin,AI 负载超越英特尔

  苏姿丰在 Computex 2024 的主题演讲中宣布,备受期待的第五代 EPYC Turin 处理器,具有 192 个核心和 384 个线程,在人工智能工作中比英特尔 Xeon 快 5.4 倍,将于 2024 年下半年推出。

  这个 3nm 芯片标志着 AMD Zen 5 架构首次应用于数据中心芯片,AMD 声称它们在关键 AI 工作负载上的性能比英特尔当前一代的 Xeon 芯片快 5.4 倍。

  Turin 据说有两个版本:一个使用标准的 Zen 5 核心,另一个使用一种称为 Zen 5c 的密度优化核心。苏姿丰还宣布,AMD 现在已经占据了数据中心市场的 33%。

  新的 Zen 5c 芯片将配备多达 192 个核心和 384 个线程,采用 3nm 工艺节点制造,然后与塞入单个插槽的 6nm I/O Die(IOD)配对。

  整个芯片由 17 个小单元组成。最高核心数型号采用 AMD 的 Zen 5c 架构,该架构使用密度优化的核心,概念上类似于英特尔的e-cores。不过,AMD 率先在数据中心的 x86 芯片中使用这种核心类型。

  配备标准全性能 Zen 5 核心的型号配备 12 个采用 N4P 工艺节点的计算芯片和一个中央 6 纳米 IOD 芯片,总共 13 个小芯片。

  AMD 声称,在 LLM(聊天机器人)中,AMD 的优势是 Xeon 的 5.4 倍,在翻译模型中是 Xeon 的 2.5 倍,在摘要工作中是 Xeon 的 3.9 倍。

  AMD 还展示了其 128 核 Turin 模型在科学 NAMD 工作负载中的 3.1 倍优势,并现场演示了 Turin 每秒生成的 token 数量比 Xeon 多 4 倍。

  192 核 Zen 5c 芯片是 AMD EPYC Bergamo 的后续系列,后者是业界首款具有密度优化核心的 x86 数据中心处理器(Zen 4c)。Bergamo 的最高核心为 128 个。

  采用 Zen 5 架构的标准 Turin 型号可扩展到 128 个核心,每个核心面积减半但功能不变,与当前一代 EPYC Genoa(最高 96 个核心)相比,实现了强劲的代际提升。

  Zen 5c Turin 芯片将与英特尔的 144 核 Sierra Forest 芯片和 Ampre 的 192 核 AmpereOne 处理器展开竞争,前者标志着英特尔在其 Xeon 数据中心阵容中首次采用效率核心(E-cores),后者则标志着谷歌和微软正在开发或采用定制芯片。

  与此同时,标准的 Zen 5 EPYC 处理器将迎战英特尔即将推出的 Xeon 6 系列。

  AMD 还分享了一些基准测试,以突出它相对于英特尔竞争型号的优势。随着 Turin 芯片越来越接近市场,我们可以期待更多的细节。

  Ryzen AI 300 系列「Strix Point」处理器

  AMD 揭开 Ryzen AI 300 系列「Strix Point」处理器的神秘面纱——50 TOPS 的 AI 性能,Zen 5c 密度核心首次应用于 Ryzen 9。

  Strix Point APU 配备了 XDNA 2 AI 加速器,AMD 表示该加速器能够实现高达 50 TOPS 的性能,领先于最近微软使用的高通骁龙 X Elite(45 TOPS)。

  作为一款具有强大集成显卡的 APU,游戏也是测试的一部分。

  AMD 希望通过其集成 Radeon 880M 和 890M GPU 来确保游戏领域的领先地位。

  根据 AMD 的演示,Ryzen AI 300 系列芯片平均性能比英特尔 Core Ultra 185H 快 36%。

  这里的平均分数取自六款主要游戏的基准测试,包括《赛博朋克 2077》、《无主之地 3》、《F1 23》、《刺客信条幻影》、《古墓丽影:暗影》和《孤岛惊魂 6》。

  代号为 Strix Point 的全新 Ryzen AI 300 系列芯片,采用全新的 Zen 5 CPU 微架构,拥有两种核心、升级的 RDNA 3.5 图形引擎,当然还有 AMD 全新的 XDNA 2 引擎,可在本地运行 AI 工作负载。

  AMD 的新品牌方案现在将 AI 直接带入了芯片名称中,这反映了公司对以 AI 为重点的全新 XDNA 2 神经处理单元(NPU)的强烈关注。

  XDNA 2 现在可提供 50 TOPS 的性能,是 AMD 第三代 AI 处理器性能的 5 倍。

  这一性能水平超越了 Windows PC 的所有其他芯片,包括高通公司前景看好的骁龙 X Elite,并轻松超过了微软对下一代 AI PC 的 40TOPS 要求,这是在本地运行 Copilot 的最低硬件要求。

  AMD 在其他方面也取得了很多进步,针对轻薄型和超轻型笔记本电脑的 Zen 5 处理器已升级到 12 核,过去只能使用 8 个 CPU 核心,而新的 RDNA 3.5 集成图形引擎最多可使用 16 个计算单元,比上一代的最多 12 个有所增加。

  旗舰级 Ryzen AI 9 HX 370 配备了 12 个核心和 24 个线程,基本频率为 2.0 GHz,峰值频率为 5.1GHz。

  不过,从品牌宣传幻灯片中可以看到,该芯片与 GPU 和 NPU 核心一起,在单片芯片上配备了 4 个标准 Zen 5 核心和 8 个密度优化的 Zen 5C 核心。

  这标志着更小的 Zen 4c 核心首次出现在最高级别的 Ryzen 9 移动系列中,因为这些核心以前仅限于 AMD 采用上一代鹰点芯片的最低端 Ryzen 5 和 3 型号。

  与标准的 Zen 5 性能核心相比,AMD 的 Zen 5c 核心旨在减少处理器芯片上的空间占用,同时为要求不高的任务提供足够的性能,从而节省电能,并在每平方毫米上提供比以前更多的计算能力。

  虽然这种技术在概念上与英特尔的E-cores 类似,但 AMD 的 Zen 5c 采用了与标准 Zen 5 核心相同的微架构,并通过较小的核心支持相同的功能,而英特尔的设计则采用了不同的架构和功能支持。

  不过,较小的 Zen 5c 核心工作时钟频率较低,因此峰值性能不如标准核心,但它们也为其他附加功能(如更大的 GPU 和 NPU)保留了芯片面积。

  HX 370 芯片还拥有 36 MB 三级缓存、50 TOPS XDNA 2 NPU 和新的 RDNA 3.5 Radeon 890M 图形引擎。

  该芯片的额定 TDP 为 28W,但其宽泛的 cTDP 范围意味着这并不能反映其实际运行功耗水平。

  Ryzen AI 9 365 配备 10 个核心,包括 4 个标准 Zen 5 核心和 6 个经过密度优化的 Zen 5c 核心,基本频率为 2.0GHz,峰值频率为 5.0 GHz。

  该芯片还配备了 50 TOPS NPU 和一个 12-CU RDNA 3.5 Radeon 880M 图形引擎,运行频率为 2.9 GHz。

  虽然 CPU 和 GPU 核心数较低,但这款芯片的 TDP 也和它的「老大哥」一样,达到了 28W,尽管这个评级现在的重要性值得怀疑。

  AMD 的上一代 7040 和 8040 系列共有九个型号,因此这两款新的 Ryzen AI 300 显然只是 AMD 新的人工智能产品系列的第一炮。

  AMD Ryzen 9 AI 300 系列基准测试表现如何呢?

  AMD 声称 LLLM 模型比当今市场上的移动处理器具有 5 倍的性能优势,但值得注意的是,尚未发布的 45TOPS 高通骁龙 X Elite 和 48 TOPS Lunar Lake 并未包含在这些基准测试中。

  不过,AMD 与高通公开发布的生产力工作基准数据进行了比较,声称 Ryzen AI 9 HX 370 在响应速度方面有5% 的优势,在生产力工作负载方面有 10% 的优势。

  该公司还提供了高达 60% 的性能优势图形性能突显其游戏实力。苹果的 M3 也被拉来比较,AMD 声称在生产力方面有9% 的优势,在视频编辑方面有 11% 的优势,在 3D 渲染方面有 98% 的优势。

  英特尔的 Core Ultra 185H 也出现在 AMD 的基准测试名单中,AMD 声称它在工作负载方面领先4%,在视频编辑方面领先 40%,在 3D 渲染方面领先 73%。在一系列游戏中,iGPU 性能比 Core Ultra 185H 高出 36%。

  接下来,压力就给到英特尔即将在第三季度推出的 Lunar Lake 处理器了。

  AMD 决定在其顶级 Ryzen 9 系列中采用密度优化的 Zen 5c 核心,这使其能够在更小的芯片面积上容纳更强的计算能力,从而为大幅扩展 iGPU 和 NPU 留出空间,这两者将在游戏和人工智能等其他方面带来红利。

  凭借 full-fat Zen 5 核心的性能优势,以及更快、更高效的新工艺节点,Ryzen AI 300 系列芯片与英特尔、高通和苹果的芯片相比极具竞争力,为 2024 年移动市场的激烈竞争奠定了基础。

  现在剩下的就是在第三方基准测试中看看这些芯片的表现了,这些芯片预计将于 2024 年 7 月面世,我们拭目以待。

  参考资料:

  https://www.tomshardware.com/pc-components/cpus/amd-unwraps-ryzen-ai-300-series-strix-point-processors-50-tops-of-ai-performance-zen-5c-density-cores-come-to-ryzen-9-for-the-first-time

  https://www.tomshardware.com/pc-components/cpus/amd-announces-3nm-epyc-turin-launching-with-192-cores-and-384-threads-in-second-half-of-2024-54x-faster-than-intel-xeon-in-ai-workload

  https://www.channelnewsasia.com/business/amd-launches-new-ai-chips-take-leader-nvidia-4382126