/ 中存储网

及早部署存储监测系统,防患于未然!

2010-07-28 00:02:43 来源:中国存储网

人要经常体检,车要经常保养,存储系统要进行监测。但是许多企业忽略了对自己存储系统的实时监测和定期检测。            

需要监测什么

如果今天问你下一财年是否需要采购更多的存储设备时,你能比较肯定地回答这个问题吗?你能马上给出一个大概的存储需求估算吗?如果不能,那是因为可能你手头可能没有正确的信息。仅仅知道目前使用多少存储资源没有帮助——你必须知道两年前使用多少存储资源,以及自那时起增加了多少存储资源。因此存储监测首先是进行存储容量监测。

比起容量检查,性能监测则是更难掌握的艺术,而不佳的性能会和资源枯竭一样对系统造成严重问题。现代存储架构通常十分复杂,为了进行全面的性能分析就必须采集大量的数据。

人们常常关注多少数据进出存储层,就像他们在监测网络时那样,不过这只是指标之一。存储系统受它们能够处理的交易数量的限制,远比受它们能够吞吐的纯数据量的限制大得多。所以,我们还要监测存储系统的交易延时。这类数据将使你看清你的存储系统在工作负载下的表现。根据经验值,在正常生产负载下小于20毫秒的交易延时属于良好水平,超过这个水平可能表明你的存储系统不堪重负。

如何监测存储系统

如何监测主存储系统通常取决于你有什么。不同的SAN和NAS制造商提供完全不同的监测能力和工具,当然也有些厂商什么也不提供。而且这些监测工具之间的差别也很大。

戴尔EqualLogic的SAN HQ存储监测软件就是一款相当简单,但却非常有用的工具。该工具使你可以通过EqualLogic Peer存储阵列内置的SNMP(Simple Network Management Protocol,简单网络管理协议)监测功能来监测它。它捕获所有重要的信息,并使查看信息变得很容易。更好的是,由于它基于SNMP,因此你可以很容易地将SAN HQ中的信息合并到其它基于SNMP的监测软件中。

如果你有一些进行SNMP监测的经验,建议去看一看Cacti。这是一款开源、基于PHP的监测框架,它利用RRDTool数据库和曲线图来维护长期的趋势数据。同使用任何免费解决方案一样,它也存在一些美中不足之处,但它具有非常强的适应性。不管是网络吞吐量、CPU使用情况、存储容量使用情况,还是硬盘延时,只要你能得到这些数据,你就能以几乎任何可以想到的方式绘制它的曲线图。

尽管Cacti需要进行一些调整才能正常运行,但带来的回报是巨大的。Cacti拥有一个活跃的贡献者社区,这些贡献者编写了易于导入的设备模板和插件。

不管你如何进行监测,一定要为你的存储架构部署一个好的监测系统。即使你不需要每天都研究监测结果,也会发现监测能力在诊断意外的性能问题时是不可缺少的。记住,历史数据赋予监测系统力量,因此你安装监测系统越早越好,否则目前未能监测到的关键信息将永远得不到了。