/ 中存储网

SSD闪存+对象存储 提供数据存储效率

2016-09-21 17:10:05 来源:IT技术网

增加对象存储的性能多达100倍是否是有可能的?现在,可能是时候将SSD闪存和对象存储同时部署在一起了,在本文中,我们将为广大读者诸君介绍关于同时使用这两者在性能和可靠性方面所带来的益处。此外,我们还将为您介绍关于提高数据存储效率的七个技巧。

现在,可能是时候将SSD闪存用于对象存储了

对象存储已经成为近线存储(Nearline storage)、云存储、Hadoop存储,甚至NoSQL存储的一个流行的首选。然而,用于对象存储的主要介质类型并不是SSD闪存存储,反而一直并将继续是3.5英寸,7200转速的HDD FAT硬盘。这背后的逻辑是,对象存储主要是辅助存储。其性能不是驱动因素。而以非常低的成本获得可扩展性、可靠性和耐用性才是对象存储销售增长的主要因素。

但是,如果对象存储所能够提供的性能较之其当前所提供性能能够增加高达100倍,并且是以相同或更低的成本提供相同或更好的耐久性和更密集的可扩展性占用空间呢?根据公开发布的SSD闪存存储和FAT HDD硬盘读取优化蓝图显示,这一愿景有望在2016年底实现。

而这一蓝图愿景的实现首先是从在对象存储中所使用的媒介类型开始的。由于大多数被作为对象存储的数据都不是需要被频繁访问的——毕竟,这都是属于次要的数据——而媒介最大的因素是成本和密度,而不是对象存储的性能。这就是为什么今天的媒介是FAT驱动器且每个HDD硬盘的存储原始容量范围是从4 TB到10 TB,这使得其能够以最小的占用空间每TB的成本最低。

读取优化的SSD闪存存储被设计为用于同一类型的数据,但仅仅只有更小的2.5英寸的足迹,这占到了3.5英寸HDD硬盘驱动器40%的容量和10%的重量。读取优化的SSD是专为约10%的写入和90%的读取而设计的。新的多层3D或垂直三级单元(TLC)NAND是理想的读取优化的SSD。目前市场上最高容量的2.5英寸,读取优化的SSD在2015年底的原始容量大约为4 TB。而这一切改变得相当...快。

在2016年第一季度,三星公司的基于256GB的TLC NAND芯片的一款32层、16 TB、读取优化、2.5英寸(SAS或SATA)的闪存SSD产品开始出货。到第三季度,几家其它的供应厂商的类似产品也纷纷出货。而预计到2016年第四季度,24 TB和32 TB的读取优化的2.5英寸固态硬盘闪存有望大规模上市。而预计到2017年,英特尔、Micron(美国镁光)、 三星和东芝的48 TB和96 TB的读取优化的2.5英寸SSD闪存产品也将出货。到2018年,上述供应厂商都期望在128 TB和256 TB的2.5英寸的读取优化的闪存固态硬盘市场获得加速增长。较之FAT 3.5英寸的近线硬盘驱动容量,今天,最大容量的HDD硬盘为10 TB。根据希捷和西部数据公司预计,到2020年,这一容量将增加到20 TB。而如果他们能够加快研发的话,则有望能够在2020年达到40 TB的容量——但这可能是一个低概率事件。无论如何,容量差距是如此巨大,而且还在进一步被快速拉开。

可靠性如何?

最近,由多伦多大学和谷歌公司联合进行的一项关于闪存SSD固态硬盘生产领域的研究显示:

原始比特误码率(raw bit error rate,RBER)在以一个非常慢的速度增长,其要比一般认为的速率慢得多。而更重要的则是,它们对于不可校正错误或其他错误模式是不能预测的。相较于传统HDD硬盘,闪存SSD固态硬盘在该领域具有明显更低的替代率;然而,它们具有较高的不可校正的错误率。

根据Gartner公司和其他业内分析机构预测,读取优化的闪存SSD和近线FAT HDD硬盘的成本交叉点——即每TB的计算购置成本,将在2016年出现。

这意味着这些大容量、读取优化的闪存的闪存SSD固态硬盘对于对象存储是最为理想的。原因如下:因为闪存NAND的本质,SSD读写次数(program-erase,PE)块更有可能出现运行失败或产生不可恢复的写操作错误。而读取操作则很少产生不可恢复的错误,虽然可能出现读取受干扰的情况,但这是极为罕见的。对象存储的纠删码基本上是在不同PE块、驱动器和节点写入对象作为多个子对象。当一个子对象有一个不可恢复的错误时,对象存储会将其简单的写在别的地方,SSD将淘汰该PE块。然后其在SSD中从过度配置的库存中维持容量能力。这使得读取优化的SSD闪存存储非常适用于对象存储。

这一切固然都不错,但SSD闪存存储——即使是读取优化的闪存SSD固态硬盘——也要比HDD贵出很多呢?其曾经的确是的。但SSD和高性能的HDD硬盘驱动器之间的交叉拐点发生在2015年。根据Gartner和业界的其他分析师们预测,读取优化的闪存SSD和近线FAT HDD硬盘的成本交叉点——每TB的计算购置成本将在2016年出现。请记住,读取优化的闪存SSD功耗和每TB的原始冷却成本平均约为10%。加上在数据中心占用空间的节省和不必使用强化地板,以处理高密度机架硬盘的重量的成本节省,使得该成本交叉点很有可能是在2016年底前出现。

使用读取优化的闪存SSD的系统将有更好的对象存储性能——高达2至3倍的速度、占用更少的机架和占地面积,而且最终成本低于当今的对象存储。对于今天的对象存储用户的好消息是,对象存储升级要比传统存储简单,可以一次在一个节点上在线进行,而无需数据迁移。

改善数据存储效率的七大技巧

存储网络、服务器端的闪存、网络缓存、软件定义的存储和全闪存或混合阵列有助于存储性能和效率的提升。

企业组织机构IT专业人员们需要长期不断地与存储性能进行“拉锯战”,以便能够确保其应用程序能够获得运行所需要的资源,实现最佳性能。而回到当硬盘技术还是最先进的技术的时候,这意味着彼时的企业组织机构所采用的是成本昂贵且效率低下的技术——比如即使不是跨数以百计的硬盘的话,至少也是跨几十个硬盘来标记数据,然后格式化这些硬盘驱动器,使得只有一半的容量能力能够提供给应用程序。

而企业组织机构更为负担得起的闪存的到来,有望在可预见的未来打破存储在应用程序性能方面的瓶颈。而为了能够充分利用闪存,您的企业组织将需要通过采用正确的方式来部署实现,并同时还需要采用正确的互补技术。这样,您企业组织才可以从固态存储部署和存储网络中获得性能最大化和更高的效率。

例如,对于常用活跃数据而言,闪存较之硬盘驱动器有较少的移动部件,故而能够提供更好的性能。其结果是,在主数据使用案例的情况下,闪存较之硬盘驱动器的部署成本往往更便宜,尤其是对于长距离持久存储。固态存储的问题是,在任何既定的时间点上,数据中心只有约5%至10%的数据是常用活跃的。所以您企业组织还不如通过将剩余的90%或更多的数据存储在容量更高、更便宜的HDD硬盘来节省一些现金成本,或者干脆和其他越来越多的企业都在做的那样,将这些剩余的数据存储在云中。

正如上文的这一例子所示,闪存本身并不一定能够提高数据存储效率和性能。您企业组织将需要从打造一个坚实的基础开始,而这也就引出了我们撰写本文所想要为广大读者朋友们介绍的关于实现更快、更高效的存储的七大技巧的第一点:改善存储网络

的确,基于硬盘的系统的延迟性并不会暴露一个网络的弱点,但一个基于闪存的系统则会。因此,当您所在的企业组织升级到闪存或为现有的系统添加额外的固态硬盘之前,您应该首先最大限度地提高您企业存储网络的能力。而您所需要考虑的关于企业网络的三个组成部分则包括:在服务器和存储系统中的主机总线适配器(Host BusAdapter,HBA)或网络接口卡(NIC)、网络交换机和布线基础设施。

人们很容易只关注带宽能力的前两个组成部分(NIC/HBA和交换机),其应该达到10GbE或16 Gbps光纤通道(FC)或更快。虽然带宽是非常重要的,延迟和交付质量更加如此。 大多数数据中心都无法产生足够的连续交易来冲击一个高速网络。相反,它们会产生数百万个非常小的交易。网络将这些交易从服务器移动到存储,然后再返回的效率是至关重要的,以便能够从一个闪存的投资中提取最大的性能。

布线也是至关重要的,而且其往往是在存储网络的性能和数据存储效率中一个经常被忽视的因素。您企业组织应该在光纤基础上建立布线基础设施,以支持当前和下一代网络的高带宽和低延迟能力,并对其进行构造,以便可以方便地确定端口分配。您企业还需要了解“链路损耗预算”,其是连接之间丢失的信号量。

一旦您已经对您企业的存储网络进行了微调,那么,是时候来考虑闪存的部署了。

实现服务器端的闪存

在服务器端的闪存设计中,网络和连接到该网络的存储仍然是相同的,基本上安装的是基于硬盘驱动器的存储阵列,其存储网络的速度和质量并没有当部署一个共享闪存阵列时那样来得重要。但是,您利用服务器端的闪存的方式则是可以改变的。

当您隔离服务器闪存时,该设计对于网络的影响是最小的。在这里,您企业安装一个固态硬盘或闪存PCIe卡仅仅只为该服务器的I/O负责。服务器本身成为一个单一故障点,所以这个用例只适用于存储在共享存储阵列上的数据的读高速缓存。

相比之下,服务器端的闪存技术,从多台服务器聚集了内部闪存,以创建一个虚拟的闪存池。这些服务器端的闪存聚合产品建立在冗余,适用于读和写缓存,甚至作为一个存储层。然而,他们确实在性能方面引入了网络因素,因为聚合需要一个网络来创建虚拟存储池。

部署一个网络缓存

不同于存储系统的升级,其仅仅只是增加了一个单一系统的性能,一个网络缓存则能够提升网络上的每个存储系统的性能。这些设备基本上是在存储系统和服务器之间内联的,缓存最常见活跃的数据。许多网络缓存在高可用性的配置中是可用的,这使得它们适合缓存读取和写入I/O。您也可以规模化网络缓存,让闪存存储区大到足以存储一家企业组织的整个常见活跃数据集,实际上把现有阵列纳入到归档和数据保护存储系统。

网络缓存的一个重要的优势在于其能够提高存储性能,而不需要更换当前的数据保护政策和程序。这些程序保持不变,因为现在的数据将同时位于高速缓存和原始存储系统上。

需要注意的是,在快照或备份作业开始之前,寻找一个可以通过编程清空缓冲区数据的网络缓存是很重要的。您也应该在部署之前,考虑您企业网络基础设施及其组件的质量。

考虑采用一款云支持的网络缓存

网络缓存选项的变体可以采用一种混合云的方式。一些供应厂商——比如Avere、微软Azure StorSimple、Nasuni和来自EMC的TwinStrata,提供全闪存网络缓存,能够将非活跃的数据迁移到诸如亚马逊、Azure或谷歌等云存储位置,而不是本地存储。事实上,这可能是通往一个全闪存数据中心的最实用的途径之一,因为现在的数据中心可以是真正全闪存的,而旧的数据已经在云中被存储和保护。

借助小闪存阵列部署SDS

改善存储性能和数据存储效率的另一种选择是使用软件定义的存储(SDS)。这些产品要么运行在一款设备上;要么在一个虚拟机系统管理程序内运行,并能够跨各种硬件阵列提供一组通用的存储软件功能。一些SDS系统可以利用现有的存储硬件,并在它们之间提供数据的自动迁移。如果您企业添加一个小的闪存阵列到现有的基础设施,您可以使用SDS自动迁移最活跃的数据集到阵列,以提高性能。而作为一个额外的获益,其还简化了管理,因为所有的存储管理变得统一。

优化应用程序

在部署一款新的或增强现有存储系统之前,务必请仔细检查您企业打算运行的应用程序。许多存储专业人员发现这一点尤其艰巨,因为他们既不拥有这些应用程序,也不了解这些应用程序的代码。好消息是,可以使用某些程序来检查应用程序的代码,这提供了一个公正的分析其质量的方法,并能够就需要在哪些地方进行改变提出具体的建议。

虽然人们很容易跳过这一步,并只是在这个问题上投入更多的硬件,但请千万不要这样做。一个与代码相关的性能问题可能被高性能的存储所掩盖,但其决不允许闪存充分发挥其全部潜力——从而迫使管理员们去寻找其他潜在的性能破坏者,如存储网络。在部署闪存之前搞定代码问题甚至可能避开一开始对于闪存的需求,或减少您企业所需要采购的闪存需求。

采购一个新的全闪存或混合阵列

这些对基于现有的硬盘系统仍然在使用寿命期限内、且仍在原来的保修期内的数据中心是理想的,这样您就可以重新部署这些旧的硬盘系统,并用一个新的闪存阵列来扩充他们。但是,在某些时候,您将需要购买新的存储系统。今天,这意味着在一个全闪存或混合阵列之间进行选择。最初的决定是相对简单的:如果企业组织负担得起全闪存阵列,其将满足企业的容量要求(假设性能要求会得到满足是可行的),然后再购买一个。

然而,许多企业组织都很难找到一款正好适合他们预算的闪存阵列。他们可以通过选择一款混合阵列,来获得一款全闪存阵列相同的益处,而又无需该水平的投资。其将闪存和HDD结合进同一系统,然后,通过软件在它们之间自动迁移数据。

对于混合阵列的主要关注:高速缓存缺失,已经是过去的事情了。当闪存容量的成本如此昂贵,以致于一个混合阵列的闪存层占总存储容量的比例还不到5%时,其是一个需要关注的问题。但是现在,闪存层往往是容量的25%(如果没有更多),显着降低了高速缓存缺失的可能性。

总结

通往存储性能提高的道路并不是从一个全闪存的投资开始的。其是从将您企业组织的存储网络作为一个整体,进行仔细的检查开始的。一旦您企业这样做了,还有很多其他的提升存储性能和数据存储效率的选项可以考虑,其中许多都包括了某种类型的闪存存储的部署。该款产品的效果会因具体数据中心的不同而有所差异,而正如本文在对这些技巧进行介绍的那样,某些企业组织的IT部门可能甚至不需要升级他们所有的存储系统。

关于作者

Marc Staimer是位于俄勒冈州比弗顿的Dragon Slayer Consulting公司的创始人、高级分析师和CDS。该公司的咨询业务一直专注于战略规划、产品开发和市场开拓等领域。凭借其在基础设施、存储、服务器、软件和虚拟化领域超过30年的营销、销售和业务经验,Marc被认为是业界领先的专家之一。

乔治·克伦普是Storage Switzerland公司的总裁,Storage Switzerland公司是一家专注于存储和虚拟化的IT分析公司。