ERP系统容灾概述
1.1 容灾的概念演变
过去,容灾主要是指灾难恢复(Disaster Recovery),随着IT技术的发展,各种业务对IT系统依赖程度的加深,对IT系统提供连续服务的要求也越来越高,容灾概念逐步演变为业务连续性(Business Continuity)概念,在中国,这两个概念基本是等价的,主要包含以下三个方面的要求:
1. 高可用性(High Availability):它是指提供在本地系统发生故障情况下,能继续访问应用的能力。无论这个故障是业务流程、物理设施,还是IT软硬件故障。
2. 连续操作(Continuous Operations)能力:它是指当所有设备无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。
3. 灾难恢复(Disaster Recovery)。它是指当灾难破坏生产中心时,在不同的地点恢复数据和应用系统的能力。
实际上,这三个方面的要求是有所重叠的,总体来说,就是要求企业应具有应对风险的能力,在软硬件故障和灾难发生时,在允许的时间范围内,继续提供相应水平的业务服务。
1.2 ERP系统容灾必要性
美国《CIO杂志》2008年曾经对大量企业的CIO们做了一次调查,85%的受访企业同意或十分同意他们的ERP系统攸关公司核心业务的推动,而且“不能没有它”。核心ERP模块主要包括会计及财务应用、采购、订单和供货商管理、库存管理、客户关系管理和人力资源管理与薪资福利等,应该说,ERP系统已经成为很多企业的命脉,它管理了企业的核心数据,是企业信息化工作的神经中枢,成为企业在信息时代生存和发展的基石,一旦ERP系统停止运行,将对企业造成巨大的损失。
下表列出了一些著名的ERP灾难,可以看出ERP系统出问题对企业造成的损失:
公司名称 |
原因 |
损失 |
OverStock.com |
ERP新功能上线引发其他功能的设计问题 |
1420万美元 |
Hershey Foods |
万圣节前夕,新上线的SAP供应链系统出错导致1亿美元产品无法发货 |
当季收入下降19%,股票下跌8% |
Nike |
ERP的供应链系统和后台办公系统升级出错 |
销售损失1亿美元,股票下跌20% |
Levi Strauss |
将分散在多个国家的多个SAP系统整合到一个统一系统时出错 |
2008年2Q净收入下降98% |
HP |
北美零散系统整合到统一的SAP系统,问题不断,项目严重超支,5倍于预算 |
项目支出1.6亿美元 |
…… |
|
|
事实上,上表列出的只是ERP系统在实施或维护过程中出现的故障,一旦发生严重灾难,如果实现没有灾难预防措施,其损失将远远超过表中数据,很多企业将因重要数据丢失而破产。像911事件后,世贸大厦中原有约350家企业,灾难发生后,有一半以上的企业破产,纽约银行因同城灾备中心离世贸大厦过近,灾备中心也同时受到破坏,使得部分数据无法恢复,一些分支机构被迫关闭,其第三季度利润因此下降了33%,而容灾措施相对完善的摩根斯坦利银行,第二天就宣布全面正常营业,德意志银行当天就恢复正常营业,并完成了3000亿美元的营业额,从中可以看出容灾措施的作用。