“史上最大IT故障”后续:影响850万台设备、需要数周才能修复

  周五的全球 Windows 系统崩溃,需要逐一进行手动恢复。

  当地时间 7 月 19 日,美国安全软件巨头 CrowdStrike 的一次软件更新引发“史上最大 IT 故障”,全球数百万台 Windows 系统崩溃,全球企业和用户都无法正常访问,几乎所有行业的正常运营都遭冲击。

  根据据媒体援引英国计算机协会成员 Adam Leon Smith 的观点,Crowdstrike 事故造成的影响“可能需要几天甚至几周的时间”才能恢复。

  据 Crowdstrike 官方给出的解释,此次大规模的系统崩溃是由其 Falcon 传感器软件更新失败造成的。微软在周六的一篇博客中表示:“

“据我们目前估算,CrowdStrike 的更新影响了 850 万台 Windows 设备,不到全球设备总数的1%。”

  但考虑到 Crowdstrike 安全软件在全球范围内的广泛部署,事故造成的影响显然程度更深。举例而言,全球范围内已有 1848 次航班在此次事故中被取消,受影响地区包括美国、澳大利亚、印度和加拿大等。

  相关数据显示,截至 2023 年底,Crowdstrike 拥有超过 29000 家企业客户,其官方更是声称其软件被超过一半的《财富》500 强公司使用。IT 咨询公司 Gartner 的分析师 Neil MacDonald 指出:

“如此广泛部署的一个安全代理,本应保护设备,却导致设备崩溃,这还是史上首次。”

  据悉,目前,解决这一问题的唯一方法是重启计算机并手动删除 CrowdStrike 的错误文件更新。而这一操作需要对每个设备进行手动访问,对于拥有数千台 Windows 设备的大型企业来说,可能需要数天甚至数周的时间来完成。

  花旗分析师 Fatima Boolani 在报告中指出:

“这家软件供应商的规模如此之大,关联度如此之高,导致任何失误都可能对全球经济系统造成损害。这可能会招致更多的政治和监管审查。”

  伯明翰大学计算机科学学院的讲师 Ian Batten 指出,此次的 IT 事故实际上通过“一次事前测试”就可以预防,看起来,这次像是有人弄错了“一点代码”。