在Netapp上显示IO

我想我可能会碰到我的Netapp可以提供的IO限制,因为我已经为我的群集添加了更多的服务器,并且iowait已经在每台服务器上运行了。

但是,我怎么量化呢? 我如何使用Netapp CLI工具来查看当前的IO统计信息? 我知道“统计显示”,但没有看到“io”对象或类似的。 我怎么知道Netapp应该能够提供什么?

如果任何人有比Netapp更多的经验,我会非常感谢帮助。

谢谢!

您有几个选项来监视NetApp文件pipe理器的性能。 这取决于DataOntap的版本。 只要执行sysconfig,你会看到版本。 您可以使用OnCommand Performance Manager作为群集Ontap的GUI工具。 性能监视器的另一个选项是集群化Ontap。 对于7-模式,您可以使用systat或statit控制台命令。

这个答案只适用于7模式 – 我没有群集模式的经验。

有性能问题,根本没有简单的答案。

你有iops的计数器,你可以用sysstat -x显示。

stats show system会给你类似的东西 – NFS / FCP / CIFS操作列表等。

但是,这些事情本身是相当随意的 – 你怎么知道它有多less“太多”的IOP?

我发现一个最有用的指标是看一致点。 再次回到sysstat -x 。 文件pipe理器写入IO的方式是填充NVRAMcaching。 这个caching被周期性地刷新,并且数据以突发方式写入磁盘。

什么types的一致性点发生是一个很好的指标,你的系统是否“快乐”。 https://kb.netapp.com/support/index?page=content&id=3014024

 T means your system is idle. (triggered by timer - not much happened for 10s, so it thought it better destage anyway) S or Z is a 'forced' cp because of a snapshot/snapmirror op. (and usually isn't a problem) F or H or L means your system is getting busy. (F is nvram filling with write data, H/L represent high and low watermarks for memory) B or b means your system is struggling. (Back to back CPs, which means your hitting the limits of your ability to write to disk. 

这几乎完全是关于写入IO。 你的系统可以挣扎的另一个原因是读IO。 写入可以很容易地被caching; 必须立即提取读取数据 – 只有在某些情况下才能将其caching。

你的统计显示计数器会给你disk_data_readdisk_data_writtensysstat -x会给你相同的,磁盘利用率的概念。 (但是要注意的是,利用率是“交叉系统”,所以如果你有一个非常热的总数与一个“冷”的平均值不会显示你)。

您也可以运行stats show volume来获取每卷IO统计信息。 这会给你一个总读/写的概念,以及它们将要读的卷。 它也区分“阅读”“写”和“其他”。 “其他”可能是相当重要的,并且是有问题的。

查看netapp支持网站的My AutoSupport部分。 它有你可以分析的性能数据,以及一些健康检查。

Netapp还提供了一个名为perfstat的工具,可以收集数据以解决性能和I / O问题:

https://kb.netapp.com/support/index?page=content&id=1013882

那么,我想你执行io-stats,并在服务器端看到“iowait”,并得出这个结论“Netapp可能会减慢”。 如果你现在看Netapp,你会发现一切,没有什么certificate你的理论。我承诺你。
不是因为Netapp存储没有足够的信息。 但是,如果你不知道自己在寻找什么,那么就不会出现问题(如果存在与存储相关的问题/性能问题)
因此,我会build议另一种方法:从服务器到存储 – 愚弄的I / Ostream量首先是如何连接服务器? 光纤通道SAN? NFS / iSCSI(基于IP)?
检查你什么时候看到“爱荷华”,你看到没有/或小io-busy的“iowait”? 并且LUN利用率低? – >这可能与运行备份有关吗?
什么服务器连接? 大多数VMWare?
I / O特性(读/写)是如何定量的?
没有alignment的I / O有问题吗?
在服务器端如何configurationI / O队列?
你应该从服务器到存储进行分析,而不是相反。 从configuration/存储拓扑的清晰图片开始。 这也可以帮助我们给你更多的想法来检查是否存在(存储)问题以及它位于何处。

OnCommand Unified Manager附带的Performance Advisor工具是您想要的。 该软件对所有NetApp客户都是免费的。 它将监控控制器,聚合,卷和LUN级别的IOPS信息。