(连载)网络存储导论第七章:系统灾难备份意义

    第七章 系统灾难备份

    7.1 容灾技术的意义

    当应用系统的一个完整环境因灾难性事件(如火灾、地震等)遭到破坏时,为了迅速恢复应用系统的数据、环境,立即恢复应用系统的运行,保证系统的可用性,这就需要异地灾难备份系统(也称容灾系统)。可以说,对于关键事物的处理系统,如联通的各项业务系统(客户服务、计费、IDC 等),建立最高级别的安全体系,也是提高服务质量、在竞争中立于不败之地的重要举措。

    长期以来,对企业而言,建立一套可行的容灾系统相当困难,主要是高昂的成本和技术实现的复杂度。鉴于此,从可行性而言,必须具有良好的性能价格比。

    建立异地容灾系统,即指建立远程的数据中心,通过配置远程容灾系统将本地数据实时进行远程复制,同时实现本地系统故障时应用系统的远程启动,确保系统的不中断运行。

    建立异地容灾中心的优势在于:


  • 强大的一级灾难抗御能力。
  • 有效防止物理设备损伤产生的灾难后果。
  • 提供99.9999%的安全机制。
  • 实时数据复制提供强大的数据交换能力。

    随着数据安全技术的发展,Cluster(HA)的技术越来越成熟,Cluster 的部署越来越普及,Cluster 技术确实解决了用户系统的高可用性问题,为业务的良性发展提供了稳定的基石。随着业务的发展,商业环境对服务供应商提出的要求也越来越苛刻,这必将使应用系统及其数据对高可用性的要求走上一个新的台阶。

    一个本地Cluster 系统理论上可以提供99.99%以上的系统高可用性,但一旦发生火灾、自然灾害、人为破坏等意外事件,服务商将如何应对呢?如果没有必要的准备和应对手段,这样的一次意外对服务上来说将是灾难性的。对于IT 部门来讲,要提高自己的抗灾能力,其必要的技术就是建立起一个容灾系统。

    7.2 容灾技术的分类

    一个容灾系统的实现可以采用不同的技术,一种技术是:采用硬件进行远程数据复制,存储工程师称为硬件复制技术。这种技术的提供者是一些存储设备厂商。数据的复制完全通过专用线路实现物理存储设备之间的交换。另一种技术是:采用软件系统实现远程的实时数据复制,并且实现远程的全程高可用体系(远程监控和切换)。这种技术的代表如VERITAS 等一些著名存储软件厂商。存储工程师在下面的章节会对以上两种技术进行详细的论述。

    容灾系统的归类在另一个方面要由其最终达到的效果来决定。从其对系统的保护程度来分,存储工程师可以将容灾系统分为:数据容灾和应用容灾。

    所谓数据容灾,就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的数据。该数据可以是与本地生产数据的完全实时复制,也可以比本地数据略微落后,但一定是可用的。

    所谓应用容灾,是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份)。建立这样一个系统相对比较复杂,不仅需要一份可用的数据复制,还要有包括网络、主机、应用、甚至IP 等资源,以及各资源之间的良好协调。应用容灾应该说是真正意义上的容灾系统。

    存储工程师先讨论一下数据容灾。

    数据容灾(硬件容灾方案和软件容灾方案均包括),又称为异地数据复制技术,按照其实现的技术方式来说,主要可以分为同步传输方式和异步传输方式(各厂商在技术用语上可能有所不同。而根据容灾的距离,数据容灾又可以分成远程数据容灾和近程数据容灾方式。下面,存储工程师将主要按同步传输方式和异步传输方式对数据容灾展开讨论,其中也会涉及到远程容灾和近程容灾的概念,并作相应的分析。