目录
第1章容灾技术规范
1.1容灾的总体规划
1.1.1技术指标RPO、RTO
1.1.2国际标准SHARE78
1.1.2.1Tier0
1.1.2.2Tier1
1.1.2.3Tier2
1.1.2.4Tier3
1.1.2.5Tier4
1.1.2.6Tier5
1.1.2.7Tier6
1.1.3界定灾备系统的适用范围
1.1.4界定灾备建设的目标
1.1.5界定灾备系统的总体架构
第2章主流容灾技术说明
2.1数据备份
2.2实时数据保护
2.2.1数据镜像(Mirroring)
2.2.2数据复制(Replication)
2.2.2.1软件复制
2.2.2.2硬件复制
2.2.2.3数据库复制
2.2.2.4DatacoreSDS
2.3应用系统恢复
2.4网络系统恢复
2.5容灾切换过程
2.6消防演习
第3章主流容灾技术分析与对比
3.1数据备份
3.2实时数据保护
3.2.1数据镜像(Mirroring)
3.2.1.1硬件镜像
3.2.1.2软件镜像
3.2.1.3软件智能存储镜像
3.2.1.4镜像技术在容灾中的利用
3.2.2数据复制(Replication)
3.2.2.1软件复制(卷复制)
3.2.2.2硬件复制
3.2.2.3基于软件控制器的复制
3.2.2.4数据库复制
3.3应用系统恢复
3.4网络系统恢复
第4章容灾系统设计步骤
4.1第一步,深化数据备份系统
4.2第二步,存储、应用整合
4.2.1存储整合
4.2.2应用整合
4.3第三步,实现远程实时数据卷保护
4.4第四步,建立远程切换消防演习机制
4.5第五步,建立远程切换机制
第5章数据容灾的性能分析
5.1同步数据容灾的性能分析
5.1.1带宽
5.1.2距离
5.1.3中间链路设备和协议转换的时延
5.2异步数据容灾的性能分析
第1章容灾技术规范
作为风险防范系统,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。
计算机信息系统实现数据大集、应用大集中后,系统的运行安全成为风险控制的焦点。目前,已经有多系统开始或准备进行灾备系统的建设,灾备系统建设的目标是减灾容灾,使计算机信息系统和数据能够最大限度地防范和化解各种意外和灾害所带来的风险。然而,与大多数工程一样,灾备系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对灾难时的切换操作等方面也存在着潜在的风险。
可以说,风险防范系统本身也存在风险点,需要小心应对。
灾备系统建设中所涉及的潜在风险大致可分为技术风险、管理风险和投资风险,其中尤以技术选择风险最大,技术方案选择优越,可以规避一定的管理风险和投资风险。而这三者也存在内在的相互关联,不同灾备级别对应的建设投资规模、所采用的技术以及实施和管理的复杂度也不同,应考虑保护计算机系统的原有投资并提高灾备系统建设投资的利用率。
1.1容灾的总体规划
真正的容灾是数据被不间断的一致性访问!
在灾难备份的世界里,是有等级观念的,级别不同,灾备系统所采用的技术和达到的功能是不同的,在系统建设资金投入方面的差距也很巨大。所以,对用户来说,明确灾备系统建设的总体规划十分必要。
1.1.1技术指标RPO、RTO
衡量容灾技术的两个技术指标RPO、RTO
RPO(RecoveryPointObjective):以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。及在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性(SCN)是不相同的,RPO表示业务数据与容灾备份数据的SCN的时间差。发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。
RTO(RecoveryTimeObjective):以应用为出发点,即应用的恢复时间目标,主要指的是所能容忍的应用停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金。
不同容灾方案的RTO和RPO是不相同的。
1.1.2国际标准SHARE78
要建设容灾系统,就必须提出相应的设计指标,以此作为衡量和选择容灾解决方案的参数。目前,国际上通用的容灾系统的评审标准为SHARE78,主要包括以下内容。
●备份/恢复的范围
●灾难恢复计划的状态
●业务中心与容灾中心之间的距离
●业务中心与容灾中心之间如何连接
●数据是怎样在两个中心之间传送的
●允许有多少数据丢失
●保证更新的数据在容灾中心被更新
●容灾中心可以开始容灾进程的能力
SHARE78是建立容灾系统的一种评审标准。建立容灾系统的最终目的,是为了在灾难发生后能够以最快速度恢复数据服务,主要体现在RTOObjective)和RPO上。SHARE78,M报告中定义的灾备的七个级别和与其对应的数据丢失量与恢复时间情况详见下表:
1.1.2.1Tier0
Tier0-无异地数据备份(Nooff-siteData)
Tier0被定义为没有信息存储的需求,没有建立备份硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复,没有数据送往异地。这种方式是最为低成本的灾难备份解决方案,但事实上这种灾难备份并没有真正灾难备份的能力,因为它的数据并没有被送往远离本地的地方,而数据的恢复也仅是利用本地的记录。
1.1.2.2Tier1
Tier1-PTAM车辆转送方式(PickupTruckAccessMethod)
作为Tier1的灾难备份方案需要设计一个应急方案,能够备份所需要的信息并将它存储在异地,然后根据灾难备份的具体需求,有选择地建立备份平台,但事先并不提供数据处理的硬件平台。
PTAM是一种用于许多中心备份的标准方式,数据在完成写操作之后,将会被送到远离本地的地方,同时具备有数据恢复的程序。在灾难发生后,一整套系统和应用安装动作需要在一台未启动的计算机上重新完成。系统和数据将被恢复并重新与网络相连。这种灾难备份方案相对来说成本较低(仅仅需要传输工具的消耗以及存储设备的消耗)。但同时有难于管理的问题,即很难知道什么样的数据在什么样的地方。一旦系统可以工作,标准的做法是首先恢复关键应用,其余的应用根据需要恢复。这样的情况下,恢复是可能的,但需要一定的时间,同时依赖于什么时候硬件平台能够被提供准备好。
1.1.2.3Tier2
Tier2-PTAM卡车转送方式+热备份中心(PTAM+HotSite)
Tier2相当于是Tier1再加上具有热备份能力中心的灾难备份。热备份中心拥有足够的硬件和网络设备去支持关键应用的安装需求。对于十分关键的应用,在灾难发生的同时,必须在异地有正运行着的硬件平台提供支持。这种灾难备份的方式依赖于用PTAM的方法去将日常数据放在异地存储,当灾难发生的时候,数据再被移动到一个热备份的中心。虽然移动数据到一个热备份中心增加了成本,但却明显降低了灾难备份的时间。
1.1.2.4Tier3
Tier3-电子传送(ElectronicVaulting)
Tier3是在Tier2的基础上用电子链路取代了车辆进行数据传送的灾难备份。接收方的硬件平台必须与生产中心物理地相分离,在灾难发生后,存储的数据用于灾难备份。由于热备份中心要保持持续运行,因此增加了成本。但确实是消除了运送工具的需要,提高了灾难备份的速度。
1.1.2.5Tier4
Tier4-活动状态的备份中心(ActiveSecondarySite)
Tier4这种灾难备份要求两个中心同时处于活动状态并管理彼此的备份数据,允许备份行动在任何一个方向发生。接收方硬件平台必须保证与另一方平台物理地相分离,在这种情况下,工作负载可以在两个中心之间被分担,两个中心之间之间彼此备份。在两个中心之间,彼此的在线关键数据的拷贝不停地相互传送着。在灾难发生时,需要的关键数据通过网络可迅速恢复,通过网络的切换,关键应用的恢复时间也可降低到了小时级。
1.1.2.6Tier5
Tier5-两中心两阶段确认(Two-SiteTwo-PhaseCommit)
Tier5是在Tier4的基础上在镜像状态上管理着被选择的数据(根据单一