/ 中存储网

九江银行成功完成异地灾备切换实战演练,开辟中小城商行“两地三中心”灾备新模式

2018-11-27 21:46:38 来源:中存储

2018年11月26日02:49,随着九江银行全行关键业务系统从九江异地灾备中心成功回切至武汉生产中心,标志九江银行本次异地灾备切换实战演练取得圆满成功。

九江银行两地三中心灾备切换

团队合影

异地灾备切换实战演练取得圆满成功

九江现场

据悉,本次实战切换演练分为以下两阶段。

第一阶段:2018年11月24日00:00开始,从武汉生产中心切换至九江异地灾备中心;

第二阶段:2018年11月26日00:00开始,从九江异地灾备中心回切至武汉生产中心。

异地灾备切换实战演练取得圆满成功。

九江至武汉

九江银行作为中小城商行中首家选择“大异地、小同城”两地三中心灾备模式的金融机构,本次异地灾备切换演练中,将全行核心、柜面、卡、支付类等42套关键系统全部切换至九江异地灾备中心,关键业务系统灾备切换覆盖率100%,平稳运行近48小时后成功回切至武汉生产中心,灾备管理能力处于全国中小城商行领先地位!

九江银行

武汉现场

异地灾备切换实战演练

ECC

本次灾备演练进一步验证了“大异地、小同城”两地三中心灾备模式的可行性,可为中小城商行进行两地三中心建设提供参考借鉴。

灾备演练方法

变更室

“大异地、小同城”两地三中心灾备建设

1.“大异地、小同城”两地三中心灾备模式选择

选择“大异地、小同城”的灾备模式是充分结合九江银行实际情况做出的研究决定。

(1)业务特点

九江银行下辖13家分行(其中省外分行2家——广州、合肥,省内分行11家,已率先实现江西省内设区市100%覆盖),先后主发起设立了20家村镇银行,传统营业网点总数突破250家。目前九江银行的业务主要集中在江西省内。

(2)风险防范和社会容忍度

九江银行在武汉光谷新建一座高等级数据中心,并于2016年12月正式投产,定位为九江银行的生产中心。武汉光谷作为国家新技术开发区具备着诸多优势,但也要考虑其位置与九江银行主要客户位于不同的地理区域。因此,在设计“两地三中心”的布局模式时,要考虑防范当武汉发生区域性灾难时,对九江银行主要客户的业务影响。选择“大异地、小同城”的最大优点在于抗灾能力强。

(3)总体拥有成本

“两地三中心”的布局模式应从成本角度出发,综合考虑投入产出,如何在投资有限的情况下,满足灾备建设及监管要求。九江银行数据中心于2015年进行扩容建设,具有足够的机柜空间资源。同时充分利用已有IT设备、链路、人员、供应商等资源,控制总体拥有成本。

2.难点问题及关键技术

在“大异地、小同城”灾备模式下,由于生产中心和异地灾备中心距离在百公里以上,中间链路时延超过10ms,无法满足数据同步复制的时延要求,此外,长距离网络带宽的可靠性以及成本也是必须面对的问题。九江银行采取如下关键技术,既满足严苛的数据复制RPO要求,又能解决长距离网络带宽和时延不稳定问题。

(1)新型的三点串行环形存储数据复制架构

我们引入Cascaded SRDF/STAR技术,建立了新型的三点串行环形存储数据复制架构(如图1所示)。在正常情况下,存储数据按照串行模式在三中心之间复制,实现异地灾备数据“0”丢失。当同城灾备中心发生异常时,可以在线转换为并行模式,克服串行模式中的单点故障。

两地三中心容灾架构

图1 三点串行环形存储数据复制架构

(2)主机同步架构

九江银行经过前期几次数据中心迁移,业务系统逐步实现了虚拟化,因此采用基于虚拟化的容灾解决方法比较便捷、可靠。通过VMware vCenter Site Recovery Manager(SRM)混合部署结合使用基于阵列的复制和vSphere Replication(VR)技术,将数据从主站点复制到恢复站点,根据实际使用需求选择基于阵列的复制或VR配置要复制的虚拟机,实现异地灾备数据中心主机的同步。

(3)多重冗余策略,保障链路稳定性

主中心至同城灾备中心存储复制通过波分设备连接,设备硬件全冗余、使用两家运营商的裸光纤、FC的SCSI协议,保障主中心至同城中心低延时、高带宽要求,充分满足了存储同步复制的需求。另外为避免链路抖动对存储同步复制带来的影响,从两方面做了优化,一是在波分侧做了双链路切换保护策略,二是SRDF参数优化,保障存储同步复制的稳定性。

(4)多举措提高复制链路利用效率、降低链路成本

通过对链路流量及复制性能数据监控分析、裁剪不必要异步数据复制流量、开启数据压缩功能等多种技术手段,来提高链路带宽利用效率,降低链路成本。

九江银行管理层一直以来十分重视业务连续性管理工作,自2015年开始,先后组织过8次灾备系统切换演练及系统迁移实施。本次演练是九江银行生产中心搬迁至武汉数据中心后举行的首次大规模灾备切换演练,九江银行管理层高度重视,全行投入科技、业务及第三方技术保障人员超过150人,监管领导悉心指导,以及各部门参与人员团结合作、齐心协力,确保演练取得圆满成功。通过这几年灾备系统切换演练及数据中心迁移,九江银行灾备系统、灾备技术手段、流程、组织的有效性得到充分验证,人员水平和熟练程度不断提高,整体灾备能力达到中小城商行中领先水平。

本文来源:中国金融电脑杂志