难以置信!两周,微软遭遇两次重大故障

  周一晚间,据微软总部所在地华盛顿州雷德蒙市报道:北美及其他地区的用户无法访问某些服务,包括 Outlook.com 网络邮件。这一故障一直持续到星期二。

  随后,微软在 Office.com 服务状态页面写道:"位于北美地区的用户试图访问 Outlook.com,可能无法发送、接收或搜索电子邮件。其他功能,如 Microsoft Teams 等其他服务所使用的日历也会受到影响。

  众包网站和服务中断报告的 Downdetector 网站显示,从世界标准时间凌晨 3 点 24 分开始,用户报告 Outlook 问题的数量激增。

  这次故障似乎只影响到微软以消费者为中心的服务。Outlook.com 是其免费的网络邮件服务,以前称为 Hotmail,与 Outlook for Web 和 OWA 不同,后者是以企业为中心的网络邮件。

  微软表示,“Microsoft Teams 等其他服务使用的 Outlook.com 功能(例如日历 API)也受到影响。” 这似乎只是对其消费者版本的 Teams 的引用。

  微软上一次遭受重大故障是在 13 天前,当时其内部团队所做的 "广域网络路由变更 "导致微软 365 用户的全球中断。具体来说,许多 Azure 云服务变得无法访问,包括 Outlook、Microsoft Teams、SharePoint Online、OneDrive for Business 等(见:Microsoft 365 云服务中断扰乱了全球用户)。

  Outlook 的访问和服务问题

  微软周二凌晨 4 点 04 分(UTC)首次确认其最新的故障,20 分钟后发推文表示“正在调查 Outlook 的访问和服务问题"。

  此后不久,微软表示此次故障与最近更改的服务器有关,并开始 "有针对性地重新启动基础设施中受最近变化影响的部分",以尝试解决这个问题。

  微软在 UTC 上午 6 点 46 分发布推文"我们的目标资源正在取得进展,我们在一些环境中看到了轻微的改善,"。另外,我们正在寻找其他方式,以加快解决。

  此次故障不仅涉及北美的基础设施,在全球范围内仍然可以看到中断现象。对此,微软在报告中解释道:"由于北美基础设施的受影响部分,北美以外其他地区的用户可能会经历一些残余的影响”。

  随后,随着微软继续重新启动许多系统一些受影响地区的用户逐渐得到改善。"

  截至 UTC 上午9:37,微软报告称,服务尚未完全恢复。"我们正在对受影响的基础设施的一个子集应用有针对性的缓解措施,并验证它已经减轻了影响。我们还在进行流量优化工作,以减轻用户的影响,并加快恢复"。

  服务恢复

  周二晚些时候,微软报告说,在问题开始约 12 小时后,问题已基本得到解决。微软说:"我们可以从遥测数据中看到,大部分影响已经得到补救,服务可用性达到 99.9%。"我们正在继续监测环境,并对显示有残留影响的后端邮箱组件进行有针对性的重新启动,以确保所有用户的恢复。"

  参考链接:https://www.inforisktoday.com/microsoft-experiences-second-major-cloud-outage-in-2-weeks-a-21134