/ 中存储网

四大灵活的灾难恢复方案

2013-10-09 00:00:00 来源:中存储

虽然监管和公共企业已经对业务连续性规划进行了详细规划,但数据中心经理并没有太多考虑灾难恢复以及高可用性要求。

灾难恢复计划是现代数据中心必须具备的,这意味着最终用户对24/7应用程序可用性的期望,而且IT  “在几乎每个业务操作中都起到十分重要的作用,” Michael de la Torre说,他是SunGard  Availability Services的恢复服务组产品副总裁。

对业务连续性的提升,也需要考虑到灾难恢复预算。

“灾难恢复预算与三、四年前相比提高了不少,”Online Tech 有限公司的运营总监Jason Yaeger说,该公司总部位于Ann Arbor, Mich.,为用户提供托管、管理服务以及云服务。实际上,在TechTarget和Readers' Choice 2013的调查中,23%受访者把冗余和灾难恢复作为2013年服务器支出的重要部分,在年度IT预算投资选项中排行第六。

灾难恢复现场的演变

在2011和2012年,根据能源部记录,美国需要面对高达10亿美元的断电记录。地铁地区数据中心容易因为较高的负载而停电, Atlas Oil有限公司的执行副总裁Bob Kenyon说,该公司为中西部地区提供燃料供应,服务约45个数据中心客户。原来越多的公司正在商业中心里建造数据中心,以减少延迟。

Kenyon说,对新数据中心建造以及现有数据中心改造或升级,灾备与意识是很重要的考虑因素。

“数据中心正在安装更大型的后备电源,而且还增加了地上和地下燃料存储,为发电机提供足够能源以应对较长时间的停电,”他说。

Kenyon已经收到了数据中心用户的需求,准备便携式油箱,以避免在数据中心因为断电而中断服务。

移动的灾难恢复选项

诸如SunGard、Rentsys Recovery Services和其他公司,会为数据中心运维和站点支持提供移动灾难恢复单元,自足型长周期发电机,并提供抵御自然灾害的措施。

“我们在美国有20个机动单元,而我已经要求再增加4个,”Ron Lapedis说,他是SunGard的劳动力连续性战略规划师,最近在对其中一个移动终端恢复单元(Mobile Metro Center)进行访问。

SunGard为各个机动单元配置了一台拖拉机-拖车型的卡车,以便可以派遣队伍到人口稠密城市地区,包括桑迪飓风后的曼哈顿市中心。

终端恢复单元,称做Mobile Metro Center,通过卫星连接到SunGard数据中心,或者驻场其他移动数据中心,避免出现延迟情况。

一些公司的移动数据中心拥有10个机柜,可以一字排开,组成连续的数据中心。用户会与SunGard签订合同,以保护关键应用程序或整个业务。

“用户需要支持物理应用程序、大型机业务、多个虚拟机以及云托管的应用程序。如今的IT是个复杂的异构环境,”SunGard的de la Torre说,用户还需要掌握灾难恢复选项以及移动单位的规格,包括存储容量或冗余。

外包和基于云的灾难恢复选项

一些企业选择将灾难恢复外包给管理服务提供商或者云托管公司,因为他们无法在位置多样性灾备方面进行更多投资,或者不具备IT从业经验或深度的专业人员。

“某些公司发现将这些元素外包后,能让他们更专注于改善运营,而无须担心失败,”de la Torre说。

他指出,使用多个数据中心的企业可以获得额外的灾难恢复优势,比如考虑将数据中心业务恢复到另外一个站点的方案。Yaeger认为,提供灾难恢复业务的公司,需要配合用户通过灾难恢复流程测试,正常运行时间和服务级别协议,地理多样性和基础设施冗余,确保外包灾难恢复符合任何法规,如企业必须遵循的HIPPA或PCI.

基于云的备份和恢复日益吸引负责灾难恢复规划的IT团队。

“人们会考虑完全基于云服务的灾难恢复方案,”Online Tech的Yarger说,他指出,这是当今IT高管所关注的。将文件备份到云存储是个熟悉的概念。但当灾难发生在部分或者全部IT生产业务时,将应用迁移至公有云中,同样面临着许多障碍,他告诫。基于云的环境无法按照内部部署生产环境结构或相同的方式来操作,而且同样存在着安全、冗余以及数据恢复等问题需要考虑。

灾难恢复的漏洞

对灾难恢复关注度的增加暴露了数据中心运营商的DR流程,政策弱点以及策略差距。最大的问题还是DR的测试,Yaeger说。Online Tech提供DR测试,但仅仅基于其自身部分的基准测试!关于云服务器恢复服务,“大部分用户都没有经常使用该功能,”他说。“大多数只进行了一次性通过的基础操作,在他们将一切都设置好了之后,仅完成了一次基础测试,随着时间流逝,就逐渐淡忘了。这可不是个好做法。”他还指出在网络规划上的差距,确保投资的数据可以从生产环境切实移动到灾备中心,需要检查流量,防火墙配置,DNS路由和其他相关元素。

因为灾难恢复选项是暂时的,很多DR基础设施不具备内置的冗余,强大的硬件和快速的网络连接。如何才能让业务尽快回到正常生产?这取决于你所安排的灾难恢复计划,Yaeger说。