/ 中存储网

重复数据删除产品采购必知

2011-05-23 09:46:26 来源:中存储
  一、重复数据删除产品采购前考虑的几大问题:
  安全问题:厂商提供的方案是否有潜在的风险,这个问题要自己反复斟酌,不要等着厂商的售前工程师主动“爆料”。
  空间占用:究竟去重率是多少,厂商提供的数据是在什么情况下进行的测试,自己的IT环境能否达到这样的去重比率。另外要注意,在去重率已经很高的情况下,再提高,释放的空间是很小的,也就是说,意义不大。
  备份、恢复等需要多长时间:是否会影响企业的业务。
  成本:我要增加什么,我必须改变成什么,更换设备需要多长时间,是否会影响业务。
  最后要仔细研究厂商给出的参数,尤其是有关吞吐量的描述。可能你实测的结果与描述会有不小的差异。
  二、源端、目标端去重的选择
  重复数据删除的选择最终取决于您希望在哪个环节实现对数据去重,以及您更偏好于在硬件层进行消重还是软件层。所以对选择什么方式没有统一答案。
  厂商和产品(W. Curtis Preston在重复数据删除讲义中列出)
  •单独的目的端去重
  Data Domain、Exagrid、Greenbytes、IBM、NEC、Quantum和SEPATON
  •集成在备份软件中的目的端去重
  Symantec NetBackup
  •集成在备份软件中的源端去重
  Asigra、Symantec NetBackup
  •单独的源端去重
  EMC Avamar、i365 eVault和Symantec NetBackup
  •二者的混合
  CommVault Simpana
  三、在线和后处理去重的选择
  在线去重即实时去重,后处理去重即异步去重。W. Curtis Preston在重复数据删除讲义曾列出管理层需要理解的几个概念:
  管理层需要了解的在线去重技术
  • 当备份完成的时候,去重操作也完成了
  • 备份数据一旦写入就开始复制
  • 后处理去重方式的厂商需要一个数据准备区域
  • 使用后处理去重方式的厂商在备份完成之前不会开始去重操作,因此整个过程会比
  在线去重的方式更长一些
  管理层需要了解的后处理去重技术
  • 当备份完成的时候,去重也基本要完成了
  • 当第一份拷贝完成后复制也随之开始
  • 我们等待的是一份拷贝的结束,而不是所有备份的结束,除非用户有这样的需求
  • 数据准备区域允许我们:
  初始备份更快
  允许最新的备份和最近的恢复来自本地数据
  允许去重交错进行
  有选择性的去重
  • 其实不一定需要那么多的数据准备磁盘空间
  • 在线去重厂商可能会让大数据量的备份和恢复变得缓慢
  他们对所有数据都进行了再水化,我们仅仅水化旧的数据
  使用在线去重技术的和使用后处理去重的厂商(W. Curtis Preston在重复数据删除讲义中列出)
  • 使用在线去重技术
  EMC Data Domain
  IBM Protectier
  NEC HydraStor
  • 使用后处理去重技术
  Exagrid
  Greenbytes
  Quantum DXi
  SEPATON Deltastor
  四、没有测试,神马都是浮云!
  在选择合适的去重设备之后,不要以为万事大吉,接下来要进行的事情对所有的问题进行测试。包括去重率、所以的运行速率、整体性能,等等。
  重复数据删除是一项非常好的技术,但完整的解决方案对于企业来说更加重要,面对林林总总的产品和厂商,企业的管理者也需要擦亮眼睛,和IT经理一起坐下来认真分析哪种方式和产品更加适合自己的业务。不要花了钱却没有获得多少实际效果。