Cloud Concentration Risk
搜索文档
AWS Outage: Billions Lost, Multi-Cloud Is Wall Street's Solution
Forbes· 2025-10-20 20:20
事件概述 - 10月20日亚马逊云服务发生大规模中断 主要影响其位于弗吉尼亚州的US-EAST-1区域 导致全球数千家公司出现连接问题和错误率升高 立即扰乱了从交易平台到消费银行应用在内的金融服务 [3] - 此次中断被归因于EC2内部网络问题 随后与域名系统故障相关 迅速成为对金融业的全球系统性风险测试 [4] 对金融行业的影响 - 加密货币交易所Coinbase和股票交易应用Robinhood均报告服务问题 限制了数百万用户执行交易和管理资产的能力 支付处理商Venmo的中断报告也激增 显示单一云故障如何冻结数字货币流动 英国机构包括劳埃德银行和苏格兰银行也出现问题 凸显现代银行基础设施的跨境脆弱性 [4] - 此类事件的财务损失巨大 互联网性能监控公司Catchpoint首席执行官表示 由于生产力损失和业务运营中断 中断的财务影响可能"轻易达到数千亿" 对于一个以毫秒衡量成功并依赖不间断全球连接的行业 即使八小时的中断也是灾难性的 [5] - 此次中断引起如此深度震动的原因是AWS服务不仅托管静态银行网站 还为金融行业最关键 最实时的功能提供支持 过去十年金融机构积极将核心系统和数据基础设施迁移至云端 寻求亚马逊平台承诺的速度 敏捷性和弹性 [7] 云服务在金融业的应用深度 - AWS已嵌入从个性化财富管理到欺诈检测的各个环节 例如汇丰银行为其财富和个人银行部门实施了云优先战略 将核心基础设施转移到AWS以实现快速创新和可扩展交付 在资本市场 金融业监管局等组织依赖该平台每日处理数十亿市场事件进行监控 [8] - AWS数据库是基础性的 银行使用Amazon DynamoDB处理高容量的支付和证券交易 这些交易需要低延迟和巨大吞吐量 其他银行则利用Amazon Aurora处理核心银行系统 寻求其跨多个可用区的高容错存储架构以防止停机 [9] 解决方案:多云战略 - 在此次及先前中断之后 金融服务公司正在加紧努力使其运营面向未来 并消除大规模区域性AWS中断所代表的单点故障 获得最多关注的是多云战略 即将关键工作负载分布在两个或更多主要提供商之间 例如AWS 微软Azure和谷歌云 [11] - 该战略不再是可选的 而是成为监管的必需 在英国 英格兰银行的SS2/21等法规强调金融机构需要制定详细的"压力退出"计划 要求银行展示如何在关键第三方供应商失败或退出市场时保持运营连续性并将关键服务转移到不同提供商甚至迁回本地 欧盟的数字运营弹性法案同样强制要求对云集中风险建立强大的防御 [12] - 实现真正多云弹性的三个战略支柱包括:工作负载可移植性 确保关键应用程序可以立即部署到不同的提供商而无需完全重写代码 自动故障转移 实施监控跨提供商云健康状况的系统 并在中断时无缝将交易流量重新路由到备份云 数据主权和驻留 使用多云解决方案遵守要求公民数据存储在特定地理位置的全球法规 [13][14]