英特尔CPU狂崩溃,测评大佬揭工艺缺陷,官方回应:补丁下月上线

  克雷西发自凹非寺

  量子位公众号 QbitAI

  “除非英特尔能够发表声明并解决问题,否则将不再推荐 Intel CPU!”

  知名硬件测评频道 Gamers Nexus 的最新一期视频,硬刚英特尔的同时,也点燃了网友们的怒火。

  原因是,GN 曝光的英特尔 CPU 工艺缺陷,也被推测是已经困扰了广大用户一年多的 13/14 代 CPU 崩溃问题的罪魁祸首。

  而在网友们看来,对于此事,英特尔一直采取“拖”字诀,迟迟没有给出回应。

  网友这一炸,英特尔也坐不住了。最新进展是,英特尔在官方社区中宣布,已经找到了问题原因。

  这次英特尔动作迅速,表示修复补丁正在进行测试,8 月中旬就会发放给合作伙伴。

  不过同时有工作人员补充说,问题的原因并非是 GN 爆料中的“工艺缺陷”,尽管它……确实存在。

  网友表示,英特尔一定非常期待这个补丁能起到作用,不然恐怕要召回数以百万计的 CPU 了。

  同时有人担心,就算有了这个补丁之后不会出现新问题,但之前的崩溃是可能已经造成了严重损坏,而且程度无法估量,所以 RMA(退货)可能无法避免了。

  但在此之余,更让这位网友好奇的是,英特尔这样一家主营 CPU 设计的公司,到底发生了什么事会出现这样的情况……

  13/14 代 CPU 频现故障

  这两代 CPU 的故障最早可以追溯到 2022 年底,主要表现是突然出现蓝屏或系统崩溃重启,尤其在游戏或压力测试等高频高压的任务中。

  严重一些的开机自检过程都无法通过,直接不能启动,连蓝屏都看不到。

  另外,还有“超出 GPU 显存”报错,以及触发反作弊软件的误报等零星故障现象。

  甚至有的网友遭遇了一整个核心直接挂掉的情况,只有把这个核心整个禁用才能避免出现崩溃。

  根据 Gamers Nexus 的介绍,这类故障主要影响的 13 代 Intel CPU 型号包括以下这 11 个,都属于 Raptor Lake 家族。

  这些 CPU 从i5 到 i9 都有涉及,另有一些 14 代 CPU 也出现了这样的故障。

  这些 CPU 都是用于台式机的型号,但就在不久之前,有人报告称笔记本上的 13 代 Intel CPU 也出现了崩溃,崩溃前运行的程序页相同。

  这些 CPU 的型号包括但不限于 13900HX,但整体上和台式机相比还是比较少见。

  另外,一位 Intel 大客户的联系人透露,他们手中有 800 万颗 13 代 CPU 可能受到影响,其中 10-25% 实际出现了故障。

  澳大利亚游戏开发商 Alderon Games 更是指控,13 和 14 代 Intel CPU 的崩溃率是 100%。

  Gamers Nexus 提到,关于故障的深层次原因,目前业界有一种猜测认为可能源于晶圆级的制程缺陷。

  具体说就是生产过程中的原子层沉积(ALD)工艺出现了问题,导致 CPU 内部的铜通孔发生了氧化。

  Gamers Nexus 表示拿到了一份声称是 Intel 内部文件的资料,里面提到了在 Raptor Lake CPU 的生产过程中,ALD 的缺陷是随机产生的,会导致铜通孔氧化进而产生高阻抗。

  Gamers Nexus 还对氧化的成因做了进一步的技术解读——在 ALD 工艺中,若抑制氧化的钽氮化物涂层没有正确沉积到位,就可能导致铜通孔的氧化问题。

  但 Gamers Nexus 同时强调,这些内容是基于现有信息的分析推测,无法 100% 被证实。

  英特尔:程序错误所致

  总之,在被 Gamers Nexus 曝光之后,这个持续一年多的故障,终于迎来了新进展。

  而且,Intel 也承认了通孔氧化的现象,但认为不是造成故障的主要原因,且这个缺陷去年底就已经修复了

  当然,英特尔是不是真的修复了这个缺陷无从考证,但即便是真的,在那之前生产的 CPU 也还是存在缺陷。

  有 Reddit 网友认为,如果英特尔“已修复”的说法属实,那么这一缺陷就确实不是造成故障的根本原因

  因为如果按照英特尔的解释,故障应只存在于早期 13 代 CPU,但事实是 13 代后期和 14 代也都受到了影响。

  英特尔经过对一些被退回的故障 CPU 进行分析,认为造成故障的直接原因是电压过高,超出了安全范围

  这似乎也与故障多见于台式机而少见于笔记本的现象相互印证,因为笔记本的功耗限制相对严格,不容易出现电压过高的现象。

  进一步深挖的话,是因为存在错误的微代码,导致 CPU 不断请求升高电压水平

  英特尔表示,针对这段微代码的修复补丁将于 8 月中旬分发给合作伙伴,然后通过 BIOS OEM 和 Windows 更新等方式推送给终端用户。

  在此之前,非官方的解决方案是通过修改相关设置限制 CPU 运行频率,从而避免故障的出现,但降频也就意味着性能的降低。

  而对于这个最新的补丁,英特尔在通告中称不会影响性能

  但在 HackerNews 上有网友说,补丁到底会怎样影响性能,以及这些已经受到了过压影响的 CPU 的老化趋势会怎样,都还有待观察。

  同时他指出,高电压不一定代表危险,补丁也可以降低电压,但已经积累的硬件损伤却是无法被挽回的

  所以除了发布补丁之外,英特尔也承诺,会向所有受影响的客户提供 RMA(退货)流程。

  参考链接: