/ 中存储网

如何基于云服务构建高可用架构,实现云备份和云灾备

2015-11-09 14:26:22 来源:AWS

近日业内连续发生了多起互联网服务的安全事故, 使得大家都充分意识到了数据备份、数据归档和灾难备份的重要性。每个公司或组织其实都随时面临着可能出现的各种事故和意外, 从病毒故障到操作失误,从水灾火灾到风暴地震,从挖掘机到黑客。在高度信息化的互联网时代,这些事故可以给业务带来灾难性的损失。无论是天灾人祸还是技术故障,IT部门必须有能力迅速恢复系统运营,保持业务能正常进行。

企业的灾备策略至关重要。 ECG调研数据 (*见备注)显示3/4企业只能承受最多3个小时的关键业务系统宕机,而有过半企业要求宕机时间不能超过一个小时,否则企业的声誉、客户的满意度和公司的财务的状况都可能受到难于挽回的重大损失。企业要制定好两个重要指标,恢复时间RTO--故障恢复时间,和恢复点RPO—可忍受数据损失的时间点。基于这两个关键业务指标,企业IT部门可以设计相应的应用架构、备份架构和灾备体系,通过使用一系列的镜像/复制等技术手段,来实现相应系统的连续性服务水平。

构建高可用高容灾的IT系统和建设IT灾备系统,二者的价值都是显而易见的。 问题是实施并拥有好的容灾和灾备能力,往往要求企业花费大量时间和精力,部署复杂和昂贵的技术和业务方案。这对于多数企业,特别是中小型企业,都是一个巨大的负担。

使用共有云的基础设施来实现数据保护、备份归档和灾难备份,拥有传统IT无法比拟的巨大优势。云灾备具备以下四个方面的优势:一是低成本,视需要使用云来备份,可以减少多达85%的灾备支出;二是无需自建管理数据中心,免去购买使用维护各种硬件所带来的烦恼;三是高效,云中建立的高可用高容错架构可以提升恢复时间和恢复点目标;四是方便,基于AWS可以简便快速灵活地构建灾备站点。

为AWS网站上为企业私有应用建立基于AWS的灾备系统的示意架构图

附图1 AWS网站上为企业私有应用建立基于AWS的灾备系统的示意架构图

附图1为AWS网站上为企业私有应用建立基于AWS的灾备系统的示意架构图。 在这个示例中,公司的数据中心部属了提供内容管理系统的包含本地存储的应用服务器和数据库服务器。 AWS Storage Gateway 是连接内部部署软件设备和云存储的服务,能够安全地将数据上传到 AWS 云服务,以提供高成本效益的备份和快速灾难恢复。AMIs 是预配置的操作系统和应用软件,用来创建Amazon Elastic Compute Cloud (Amazon EC2)的虚拟机.。应用服务器快照以及服务器恢复所使用的Amazon Machine Images (AMI)都存储在Amazon Simple Storage Service (Amazon S3)上。对于数据库备份, Oracle数据库可以使用Oracle Secure Backup (OSB) 的云模块直接备份到Amazon S3 上。当公司的数据中心发生灾难的时候,可以在 Amazon Virtual Private Cloud (Amazon VPC)中重新创建完整的基础设施 ,使用Amazon EC2对于应用和数据库服务器进行重建。为了还原卷快照,可以使用 Amazon Elastic Block Store (EBS)卷与待恢复的应用服务器绑定在一起。为了远程访问复原的应用,客户可以使用通过VPC网关创建的VPN连接, 或者建立专线直联Direct Connect。

附图2使用AWS多可用区建立高可用高容错应用的示意架构图。亚马逊AWS鼓励用户使用云端的多可用区(Availability Zones),这样可以创建高可用性的系统,并保证系统好的容灾能力。 AWS将其公共云服务划分成十一个区域,而且在每个区域内都配置了多可用区。近日, AWS中国区北京区域有限预览已开始提供第二个EC2可用区。如何使用AWS多可用区构建高可用性号容灾性的架构,是云时代IT架构师首先要学的基本功。

附图2 使用AWS多可用区建立高可用高容错应用的示意架构图

附图2 使用AWS多可用区建立高可用高容错应用的示意架构图

亚马逊AWS云服务还为建立备份和灾备提供很多现成的服务功能。AWS 云支持许多常见的灾难恢复 (DR) 架构,从收到通知即可扩展的“指示灯”环境到支持快速故障转移的“暖待机”和“热待机”环境,均可有效支持实现部署。下面我们简要描述一下基本和常用的使用场景。

数据云备份

亚马逊S3是设计为拥有11个9的持久性,可以方便的提供数据的备份服务。 企业自有的数据可以通过互联网备份到云上,并随时可以从任何地方还原使用。在AWS运行的存在EBS上的数据可以通过快照存在S3上,以供在需要时还原到云上或私有的机房。

附图2 使用AWS多可用区建立高可用高容错应用的示意架构图

附图3 利用S3实现数据备份

指示灯(Pilot Light, 或叫守护灯)服务

在这种相对低价的备份方案场景中,用户在AWS云上设置运行一个最核心的应用系统环境,例如一个在进行镜像复制的数据库服务器。 当灾难来袭时,依据已预先规划好的方案, 客户在云里自动快速全方位部属建立完整系统所需的其它应用和架构, 与已在运行的核心系统一起,构成一个完整的业务应用系统, 承担起生产系统的责任。

附图4 利用AWS实施“指示灯服务”灾难备份

“暖待机”和“热待机” 服务

在这种更高效的备份方案场景中, 一个完整具有全部系统功能的应用环境被建立在云上,并应经在运行。 在“暖待机”服务的情况下,所有应用和数据服务器按已经缩小了的最小规模在运行。 当灾难来袭时,它们被迅速自动放大以承担正常生产的负载。对于更关键的业务应用,客户则可以选择性能更高但价格也更昂贵的“热待机”服务,即在云中部属运行能够支持正常生产负载的环境,实现所谓高级别的“异地多活”部属。无论是暖热待机,通过适当安排,这些待机的服务器平时还可以用来做调试和测试等用处。

附图5 利用AWS实施“暖待机服务”灾难备份

云备份的概念虽然简单,但其有效部署实施对云的运营商有很高的要求。 AWS因为拥有AMI、 EIP/ENI、ELB、Auto Scaling、VPC、 Cloud Formation和多可用区等众高性能的云服务和多年的商业运营经验,使得上述这些云备份方案得以有效的部署和实施,并拥有众多可供用户借鉴的成功案例。

如果您想更多了解如何在 AWS 云中架构灾备系统,请你浏览AWS关于云灾备的网页:http://aws.amazon.com/cn/disaster-recovery/,