推广 热搜: 集成  系统集成  弱电  软件  kvm  服务器  思科  拼接  视频会议  SFP 

亚马逊平安夜宕机细节:负载均衡出错

   日期:2013-01-06     来源:51cto    作者:路途    浏览:152    评论:0    
核心提示:据国外媒体消息,2012年圣诞夜(12月24日)专门提供视频流的Netflix服务中断了近20小时,并说明是因Amazon云(AWS)故障而造成的影响,Amazon随后出面解释,因负载均衡服务(Amazon Elastic Load Balancing Service,ELB)的数据误删除引起的。

据国外媒体消息,2012年圣诞夜(12月24日)专门提供视频流的Netflix服务中断了近20小时,并说明是因Amazon云(AWS)故障而造成的影响,Amazon随后出面解释,因负载均衡服务(Amazon Elastic Load Balancing Service,ELB)的数据误删除引起的。

Amazon ELB从故障到完全恢复的时间为2012年12月24日的中午12点24分到12月25日的12点05分。Amazon说明,该站的开发人员在进行维护时不小心删除了ELB上的状态数据,这些数据是用来管理美国东部的负载均衡器,但当时没未发现,一直到ELB控制盘在呼叫API来管理负载均衡器时不断出现延迟及错误提示才得知,且只有少数的ELB负载均衡器受到影响。

一开始Amazon并未发现出错的原因,而以为是API错误,随后AWS的客户才提交他们在更改负载均衡的设定后性能出现问题,Amazon才发现症结,并回复遗失的ELB数据。

Amazon表示,在最高峰的时候,只有6.8%使用负载均衡器的服务受到影响,因为其他的负载均衡器无法由客户自行扩展或修改而未受波及,AWS团队先进行手动回复受到影响的负载均衡器,随后装回移失的ELB数据。

除了道歉外Amazon给出补救措施,包括提出更严谨的规定以降低ELB状态数据被误删的风险,由此次的经验修改数据恢复流程加快数据恢复速度。

 
打赏
 
更多>同类资讯
0相关评论

 
推荐资讯
点击排行

网站首页  |  付款方式  |  版权隐私  |  使用协议  |  联系方式  |  关于我们  |  网站地图  |  排名推广  |  广告服务  |  RSS订阅  |  违规举报  |  京ICP备11008917号-2  |