周一,美国乃至全球范围内的众多网站和在线服务陷入瘫痪。原因是亚马逊云计算服务(AWS) 出现故障,导致数以百万计用户无法使用多个主要游戏、媒体平台、串流服务及其他应用程序。 亚马逊表示,这家支撑着互联网大部分基础设施及日常在线工具的云服务提供商,由于其一项核心数据库产品出现问题而离线。截至周一上午,公司称相关问题仍在持续。 这次宕机事件波及范围极广,从 Snapchat、麦当劳App、亚马逊的Ring门铃摄像头,到游戏平台 Roblox 和 Fortnite,均受到影响。事件凸显出依赖云端服务器托管数据的企业(包括金融服务机构)在面对突发性技术故障时的脆弱性。一次意外中断,就可能让全球范围内的业务陷入停摆。 亚马逊网络服务公司(AWS)表示,最早在美东时间凌晨3点11分发现问题,当时其位于美国东部弗吉尼亚北部(US-East-1)数据中心的 14 项服务出现“运营故障”。根据网站 DownDetector 的统计,全球超过 1000 个网站和服务一度离线,共收到 650 万份用户报告。 此外,美联航(United Airlines)、T-Mobile、星巴克(Starbucks)和麦当劳(McDonald’s) 也受到了波及。达美航空(Delta Air Lines)表示宕机导致小部分航班出现延误。美国联邦医保计划 Medicare 的网站似乎同样受影响,正在参与开放注册期的用户周一下午无法登录系统。英国政府的税务与海关总署(HMRC)网站也出现故障,部分用户无法访问。 到美东时间早上6点35分,AWS 称导致宕机的数据库问题已“完全缓解”,但警告可能仍会出现延迟。然而在早上10点14分,AWS又确认 “US-East-1 区域多个服务出现严重的 API 错误与连接问题”,并表示正在调查。 公司指出,问题源自亚马逊EC2内部网络的错误,波及多项 AWS 服务,包括 DynamoDB、SQS 与 Amazon Connect。AWS 在美东时间上午11点43分的声明中解释称:“根本原因在于我们内部的一个底层子系统出现异常,该系统负责监控网络负载均衡器的运行状况。” 负载均衡器是一种用于在多台服务器之间分配流量的关键技术。 AWS 表示,目前正在限制客户的新请求活动,以便尽快恢复服务的全部功能。 AWS此前也曾出现类似事故,2023年曾短暂宕机,而2021年的那次中断更是持续了超过5小时,导致用户无法访问航空订票系统和支付应用。 这一次,社交媒体上充斥着关于宕机的投诉:从云端游戏、社交平台,到亚马逊旗下的 Prime Video 和 Kindle 等服务,全都受到影响。 连加密通讯应用 Signal 也一度瘫痪。非政府组织 Article 19(致力于推动言论自由)因此警告称,这类大规模宕机不仅是技术问题,更是民主层面的隐忧。 Article 19 数字事务负责人 科琳·卡斯-斯佩斯(Corinne Cath-Speth) 表示:“这些中断不只是技术故障,它们是民主体系的失败。当一家云服务提供商‘熄灯’时,关键服务也随之下线,媒体网站无法访问,像 Signal 这样的安全通讯应用停止运行,我们数字社会赖以运转的基础设施顷刻间崩塌。” 此外,美国最大加密货币交易所 Coinbase 也表示,其服务因 AWS 宕机而暂时无法使用。 根据监测网站 DownDetector 的数据,交易平台 Robinhood、支付应用 Venmo 以及语言学习应用 Duolingo 等,也都在周一出现了不同程度的服务异常。 多家媒体机构同样受到波及,包括迪士尼(Disney)、纽约时报(The New York Times) 和 华尔街日报(The Wall Street Journal)。美联社(Associated Press) 表示,其新闻系统也受到影响,已启用备用系统 “AP Backup”,以便用户仍能访问突发新闻。 更棘手的是,AWS 的自动客户支持工单系统也随之宕机,导致用户一度无法上报问题。 AWS 不仅为客户提供数据存储,还支撑着各种在线业务,是全球云计算领域的主要参与者之一。近年来,亚马逊也在该部门积极投资人工智能产品。在 2024 财年,AWS 创下 1070 亿美元的营收,占亚马逊总收入的 17%,是公司最赚钱的业务板块之一。 信息来源:NBC
发表评论 取消回复