/ 中存储网

从戴尔DX对象存储看归档设备的发展

2011-08-22 12:28:34 来源:中存储

大约2个月之前,戴尔公司宣布了一系列新的存储产品。一方面扩大了与长期伙伴EMC的OEM合作关系,转售EMC Data Domain重复数据删除系统和Celerra统一存储阵列;另一方面,戴尔还宣布对采用了赛门铁克和CommVault软件的PowerVault DL2100磁盘备份系统进行升级,同时推出了可以处理块存储和文件存储的PowerVault NX3100 NAS解决方案,并公布了一款新的基于目标(对象)的DX存储系统。
在上述新品中,包含有2类不同的重复数据删除解决方案,其中Dell|EMC Data Domain系列是基于硬件的,而PowerVault DL2100的源端Dedupe功能则是通过与其捆绑的Symantec Backup Exec 2010或者CommVault Simpana 8数据保护软件来实现的。我们觉得后者主要是通过戴尔MD1000系列(或者相同级别)直连存储在价格上的优势来吸引备份用户,并利用与EqualLogic或者Dell|EMC这些主存储快照功能的无缝集成,进一步完善戴尔的磁盘备份产品线。
至于另外2款已经上市的产品,都属于既支持NAS文件访问又支持SAN块访问方式的“统一存储”。直接转销EMC的产品在技术方面其实没有什么差别,更多反映的是商业合作模式的发展;而PowerVault NX3100也是在Dell原有NAS产品线基础上推出的新型号,并不怎么让人觉得新鲜。
这次真正吸引我们的,是戴尔“自主开发”的DX对象(Object,或称为目标)存储系统。目前它已经在国外正式发布,不过中文网站上暂时还看不到相关的内容和资料。

从戴尔DX对象存储看归档设备的发展
戴尔DX对象存储系统
来自非结构化数据的挑战
在上个月的存储时间栏目中,我们谈到了非结构化数据的增长对存储厂商产品策略带来的影响。可以说这些需求直接为NAS类存储销量带来了持续的增长,并催生了支持更高容量和性能的向外扩展型NAS高端产品的出现,包括惠普的StorageWorks X9000系列和IBM SONAS等。
IDC在《2010数字宇宙研究》报告中指出:在2010年,数字宇宙(指代由全球所有消费者和企业所创建的数据,包括视频、音频和文件等)将增加1.2 ZB,或者120万PB。到2020年,数字宇宙将是2009年的44倍。同样出人意料的是,由于文件的平均体积越来越小,对象数目(即数据中包含的文件数量)的增长速度将超过数据总量——即使很多大型视频和音频文件被创建,由此设备和感应器等还创建了大量的小型文件。
从某种意义上来说,“对象存储”就是为了解决文件数量的增加而产生的,但又不仅于此。本文并不是要向大家详细讲解对象存储的概念,但我们希望能够通过戴尔DX来介绍对象存储的一些特点,并且比较它和传统文件存储方式之间的区别。

对象存储:一种新的长期文件存储方式
其实“对象存储”已经不是一个新概念了,只是在最近被提到的频率有所增加。
“Long-Term File Storage”这个名词让我想起了上周IBM介绍的“基于LTO-5磁带技术的Long Term File System”,二者同样是针对长期数据保存。LTO-5的介质分区功能通过在磁带设备上增加一个“索引”,而IBM Long Term File System进一步使用户能够像磁盘那样的方式来访问磁带。比如说可以精确定位一盘磁带上需要读取的部分数据,而不用再像以前那样从头搜索整盘磁带以确定数据开始的位置。
LTO-5因此宣称能够在磁带上实现“近线存储”应用,然而我们不要忘了磁带的随机访问需要经过倒带的时间过程,而且在一盘磁带的寿命中倒带次数是有限的,这使得它仍然只适合顺序类的访问。真正对访问时间要求较高的近线存储还是应该使用随机性能更好的磁盘设备来完成。

从戴尔DX对象存储看归档设备的发展

“文件”和“对象”之间的差别
上图是举例来比较与“对象”和“文件”相联系的元数据(metadata)量之间的差异。也就是说对象存储通过把大部分的元数据附加到文件上,从而为文件添加一种标识信息,减少了在存储系统中需要统一存放和管理的元数据量,便于进一步扩展。

在NAS产品中,我们知道惠普的StorageWorks X9000系列和IBM SONAS分别能够支持最大16GB和14.4GB的全局命名空间,这里的限制就是庞大的数据量和文件个数对NAS文件系统元数据索引处理能力的要求所致。在一些特定应用环境下,平均每块硬盘上存储的文件数量可能高达几千万,这时基于对象(目标)的存储设备就更为合适了。

对象存储与传统NAS共存

从戴尔DX对象存储看归档设备的发展

对象存储的市场定位
数据使用的频率也是选择对象或者传统文件存储要考虑的一个因素。如上图,在新产生的数据中大约30%属于“热数据”,它们对磁盘性能、数据保护、可用性和安全性的要求相对较高,传统的块存储(SAN)和文件存储(NAS)是针对这些数据的。而另外70%的属于“冷数据”,也就是说在创建之后很少或者从来不被访问,它们更多需要的是可管理性(信息生命周期,ILM)、可访问性、可扩展性、储存和成本。后面这部分就是适合对象存储来处理的,当然对象存储本身也属于存档(归档)类应用的范畴。