/ 中存储网

Datos IO:我们要将高端备份方案引入云数据保护堆栈

2017-06-26 00:52:02 来源:至顶网

Datos IO公司打造出一套独特的数据保护实现方案,其与以往基于介质服务器的数据保护有所区别,转而使用专用型备份设备。

Datos IO:我们要将高端备份方案引入云数据保护堆栈

该公司解释称,此套方案主要强调应用程序对于数据的存储与管理方式,这一点与其它数据保护厂商(例如Cohesity、Rubrik以及Veeam等新兴企业)有所不同。

我们就此与该公司CEO兼联合创始人Tarun Thakur进行了交流,希望通过一系列问题以了解这种差异的具体细节。我们对于谈话内容进行了编辑以确保更易于理解。而大家可能会注意到,他给出了一些相当全面的回应,足以帮助大家明确了解其观点。

记者:专用备份设备(简称PBBA)市场为何会遭遇下滑?

Tarun Thakur:我们的基本前提在于由“应用程序”定义对IT堆栈的实际选择:从数据库的选择到存储的选择,再到数据管理方案的选择。而其中的数据管理方案则包括从备份与恢复软件到专用备份文件系统/设备、到归档软件、再到存储管理软件以及归档存储的一切因素。

考虑到以下现状:

  1. 传统应用程序正逐步转移至云端(对于一切非恢复用例,例如测试/开发与主要应用程序实例);
  2. 各类第三方平台应用程序(分析、物联网等等)开始以云作为开发平台;
  3. 应用程序数据如今开始全面进行预压缩,这意味着传统的重复数据删除功能将不再具有实际意义;
  4. 开始广泛使用非共享型非关系型与云原生数据库架构;
  5. 云基础设施植根于计算与存储的云原生层——而非LUN或者虚拟机;
  6. 丰富的分析服务(例如Amazon Athena)现在已经能够以原生方式直接应用于云存储。

这一切都令以往专用备份设备(简称PBBA)所引以为傲的经典可变长度或固定数据块重复数据删除功能变得毫无用武之地,意味着其已经无法适应全新应用程序与多云时代的实际要求。

这些影响因素综合起来共同造成了PBBA市场全面下滑的现状。

记者:公有云的崛起给数据保护市场带来了怎样的影响?

Tarun Thakur:一系列研究已经证实,与传统的内部部署交付模式相比,Amazon/Azure云部署方案能够带来更为可观的投资回报且投资回报周期更短。

正因为如此,再加上IT方案的主要消费者如今正转变为应用程序所有者及DevOps人员,同时传统应用程序越来越多迁移至云端,而下一代应用程序甚至开始以原生方式在云端进行开发。

由于存在这种架构化差异以及新的约束条件(即无需访问虚拟机管理程序、无需SAN/NAS存储设备介入等等),因此能够在云环境中获得成功的数据保护解决方案必须在数据保护架构与设计方面进行全面重构。

……传统数据保护解决方案只是简单将产品升级至云端,这也导致其对于本地仍然对于本地附加存储具有严重的依赖性,且实现成本也要远高于公有云直接提供的可扩展对象存储方案(例如Amazon S3)。而Datos IO公司正是面向此类云原生解决方案进行自身产品优化。

最重要的是,传统备份软件产品的以往架构会彻底破坏数据的原生格式,这意味着客户会被自己的数据所胁持,因此几乎没有能力实现数据货币化或者跨多云边界进行数据调动。

记者:您是否认为客户将全面投入公有云环境,或者其更倾向于将内部与公有云IT堆栈同某种形式的数据管理方案加以结合,从而同时涵盖这两种环境?

Tarun Thakur:我们坚信,任何拥有大量应用程序与数据库的企业都必将生存在“多云”世界当中:一部分应用程序将以本地方式运行,而其它应用程序则立足公有云环境保持运行。

因此,我们认为趋势的最终走向绝不会是二中选一的“非此即彼”。

企业已经开始并将继续保留内部基础设施以承载一部分关键性业务应用程序。具体来讲,这部分应用包括各类辅助型应用用例,例如灾难恢复、测试/开发、性能分级以及持续集成/持续交付等等。

这些企业当然也希望有能力建立一份适用于公有云平台的应用程序版本,从而帮助开发人员获得更理想的敏捷性/生产效率,同时将一部分IT支出由传统的“采购”形式转化为公有云提供的“租赁”形式。

记者:您的意思是数据保护业务在本质上属于数据复制业务,而客户应当有能力对这类数据副本采取更多操作,而非单纯借此防止源系统发生故障或者遭遇数据泄露?

Tarun Thakur:……在内部环境当中,数据保护的本质确实在于数据复制,这是因为大多数应用程序都被绑定至单一数据库。而云服务的出现正在重新定义这种范式:云环境中的数据保护不再只是数据复制,这种作法只是种新瓶装旧酒的自我重复(云环境作为瓶子存在)。

……我们的副本不再处于LUN层、虚拟机副本或者虚拟机文件备份当中; 相反,Datos IO公司致力于立足表格、记录(行)以及列理解您的应用程序数据。因此,我们的产品允许您立足辅助存储(实现数据库的快速恢复与维护(即保留原生格式)、在不同存储点内建立分布式应用程序状态,并最终实现由内部环境指向云或者多云环境的高效迁移。

记者:如果PBBA供应商将其软件运行在云环境中,会造成怎样的问题?我们又该如何解决这些问题?

Tarun Thakur: PBBA供应商已经开始采取一种以面向其“应用节点”写入为基础的架构。他们将这些“节点”迁移至昂贵的软件计算节点之内,同时挂载高成本EC2存储以处理那些无法给“云”解决方案带来任何实质性效率或者经济收益的写入工作负载——事实上,这类方案最终仍然要将数据转移至S3之内。

……直接被照搬至云端的PBBA与介质服务器仍然基于原本的附加存储设计思路,其实现成本相较于Amazon S3等公有云存储基础设施要高出一个量级。

全部受保护数据必须由终端应用节点被引流至介质服务器。这种作法在地理分布广泛的多云世界中根本没有任何扩展性可言。PBBA已经成为一种性能瓶颈,且无法处理目前云环境中广泛流行的大规模数据。

……相当一部分数据类型——例如向外扩展数据库事务——在结构上具备bit惟一特性,意味着我们无法利用逐bit数据拆分/数据块重复数据删除机制对其进行体积削减……

记者:目前已经有其它一些厂商迈入所谓云数据管理领域,并提供多种数据保护与其它服务——包括Veeam、Cohesity以及Rubrik等。Datos IO的技术方案与Veeam、Cohesity以及Rubrik存在哪些区别?

Tarun Thakur:Veeam公司基于一套介质服务器架构,其中数据由VMware(或者其它同类服务器)被导流至配备有附加存储的介质服务器上的目标代理内。而其重复数据删除技术部分作用于来源,部分作用于目标。

我们与Veeam的方案存在以下根本性区别:

  • 所有受保护数据皆需要通过Veeam介质服务器进行导流,而这种方式将无法在地理分布广泛的多云环境下实现规模化扩展。其中的介质服务器将成为瓶颈所在,且其对附加存储的高强度使用将带来十倍于云部署模式的成本水平。
  • Veeam主要用于处理不透明的数据块与文件,因此无法提供细粒度数据保护或者搜索等高级数据管理服务。
  • 尽管Veeam方案因运用VSS而更擅长实现应用程序事务一改,但由于Veeam无法理解受保护数据的具体结构,因此其不具备真正的“以应用程序为中心”特性。
  • 随着对越来越多进行数据压缩以提升传统及下一代应用程序的计算吞吐量,采用可变长度重复数据删除功能的作法将无法进一步实现存储空间压缩以及WAN加速。
  • Veeam将云数据存储视为长期保留目标,而Datos IO则利用语义重复数据删除技术将这些数据存储用于二级存储。

记者;那么Rubrik与Cohesity的方案又存在哪些问题?

Tarun Thakur: Rubrik与Cohesity(即PBBA替代性供应商)均采用基于介质服务器的设计架构,其中数据由VMware(或者其它同类服务器)被传输至配备有集成化存储资源之超融合型介质服务器上的目标代理当中。

以下则是我们与Rubrik以及Cohesity的根本差异所在:

  • 由于超整合型方案的天然特性,所有受保护数据都必须被导流至介质服务器。与Veeam类似,这种方式无法在地理分布极为广泛的多云环境下实现规模化扩展,并将成为整套体系中的瓶颈所在。
  • 集成化存储方案在操作成本方面要比云部署模式高出一个量级。
  • 这套面向不透明数据块与文件的保护方案无法提供细粒度数据保护或者搜索等高级数据管理服务。尽管VSS能够提供出色的应用程序一致性表现,但Rubrik与Cohesity仍然缺乏对于所受保护数据之具体结构的认知。
  • 随着对越来越多进行数据压缩以提升传统及下一代应用程序的计算吞吐量,采用可变长度重复数据删除功能的作法将无法进一步实现存储空间压缩以及WAN加速。
  • Rubrik与Cohesity皆将云数据存储视为长期保留目标,而Datos IO则利用语义重复数据删除技术将这些数据存储用于二级存储。

Rubrik与Cohesity在本质上面向第二平台或者Mode 1应用程序(即基于SQL服务器或者虚拟机)类工作负载,而非云原生应用程序、非关系型数据库、分布式应用程序以及第三平台时代下的各类工作负载。

记者: Datos IO公司希望在未来五年内实现怎样的产品能力?

Tarun Thakur: ……我们将继续……构建数据保护以及移动用例,确保其适用于广泛的运营数据源集合——同时包含MySQL等传统场景以及Amazon DynamoDB等面向云之场景。

这种对丰富数据源的支持能力使得我们能够捕捉更为庞大的数据量,进而使我们得以为应用程序及业务所有者交付更多先进数据管理服务。以此为基础,我们还能够建立起“云规模数据中枢”这一发展愿景,即涵盖以下服务方向的广阔功能范畴:

……我们希望提供一套全球分布式元数据目录,用以涵盖公有云与私有云之间的一切数据孤岛。

……在特定数据保护与移动实例当中,数据管理员将拥有这样的底层用例:随处备份、随处恢复、随处迁移。

评论意见

Datos IO公司的技术主要面向身处或者使用公有云环境的应用及数据,且特别适合各类云原生类工作负载。根据该公司CEO所言,这是一套远超传统或者遗留备份软件、专用备份设备(包括Data Domain)、专注于虚拟服务器之产品(例如Veeam)以及其它新型产品(Cohesity与Rubrik)的强大数据保护方案。

虽然说得非常漂亮,但其产品是否真的如此卓越?这个终极问题的答案恐怕只能交由时间来判断了。