我有HP Proliant DL380 G7 w / HP SmartArray P812 W 1G-BBWC,它通过1根mini sas电缆插入D2600存储盒。 所有firwmware版本都是最新的(包括磁盘)。 还有内部的背板插入内部SAS端口。
在1TB SATA磁盘上有一个RAID 5存储arrays(跨越3 * 4TB SATA磁盘)和三个RAID 1arrays。 此外,还有连接到控制器内部端口的内部SAS 2.5英寸磁盘。 3 X 300GB Raid 5和2 X 300GB RAID 1.此问题似乎影响D2600机箱中的“内部”磁盘和磁盘。
我在这个系统上有一些非常奇怪的性能问题,我无法追查。
服务器正在从内部HP Enterprise USB存储设备运行ESXi 6。
低磁盘负载,没有问题。 这是问题的起点。 如果我将一个基准testing文件从一个磁盘arrays复制到另一个磁盘arrays,它最初以250mb / s的速度随机启动(10到45秒)。 在此之后,磁盘IO下降相当大,变得非常随机。 (见截图)。
高清调谐图
如果IO负载继续,最终传输将降为0,并且arrays完全停止响应。
同时,ESX主机logging下列内容:
Device naa.bla performance has deteriorated. I/O latency increased from average value of 5134 microseconds to 434632 microseconds.
同一台服务器上的Linux服务器显示以下结果:
在这里input图像说明
值得注意的是1800毫秒的延迟!
如果arrays完全停止响应,则唯一的恢复方法是重新启动主机。 这发生在所有数组中,不pipe它的内部还是外部都没关系。 我已经尝试了第二个D2600和一个不同的SAS电缆。 不用找了。 禁用Windows写入caching或驱动器上的磁盘caching本身没有区别。
我完全被困在这个阶段,撕掉我的头发,任何帮助将不胜感激!
您正在运行HP DL380 G7,它应该有一个内置Smart Array P410arrays控制器。