容灾和灾备的区别是什么?
不少刚接触该领域的朋友面对容灾、灾备、灾难恢复、容灾备份、灾难备份...这些名词的时候,虽然知道这其实都是指的一回事,但是还是难免有些迷惑,到底哪个更准确?
首先,这些中文都是基于国际上通用的“Disaster Recovery”这个专业名词得来,直接翻译自然是“灾难恢复”。我国颁布的相关规范标准命名如《重要信息系统灾难恢复指南》、《信息系统灾难恢复规范》。
然后我们一个一个的仔细看看它们的意思:
容灾(Disaster Tolerance) Tolerance翻译过来是忍受、容忍的意思。Disaster Tolerance在英文世界里用的并不多,在SUN Cluster的一份资料里有如下内容:
What Is Disaster Tolerance?
Disaster tolerance is the ability of a system to restore an application on an alternate cluster when the primary cluster fails. Disaster tolerance is based on data replication and failover.
翻译:
什么是容灾能力?
容灾能力是系统在主群集出现故障时在备用群集上还原应用程序的能力。容灾能力基于数据复制和故障转移。
结合理解一下,容灾是指灾难来临,我们的系统可以承受多少,包括:
是不是可以无视小型灾难?(比如:网络攻击防范,硬盘故障等)
是不是能够直接无缝切换到备用系统?(有无双机等高可用设计?有无数据库的同步系统?有无异地灾备中心?)
是不是能够在系统瘫痪后快速恢复?(灾难前有无备份?灾难发生后,备份能否恢复回来?能恢复多少?)
有无完善的组织、计划及相关人员?(为各种灾难场景提前做灾备演练,提高灾难来临时的恢复成功率)
这些其实都是容灾能力的体现。
定义:容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务的所进行的一系列系统计划及建设和管理行为。
灾难备份、灾难恢复单从字面上理解,只能作为容灾的其中一部分了。
学习BCM后,我们会更清晰的理解到,容灾是个全面的工程,保障业务连续性是终极目标。这需要很多工作,不光是IT系统的建设。