我有一个PERC H200i的戴尔PE T710,它有一个6x 500GB SATA磁盘+1热备份的单个arrays。
这个服务器(和它的磁盘)已经运行了几年了。 今天,我开始在该服务器上获得高IO等待时间的警报。 我调查和磁盘arrays莫名其妙地慢。 没有任何应用程序推动IO的最低水平,大约22 MB / s的线性读取或写入(使用dd)将达到饱和,我会开始看到100%的IO等待在顶部。 在同样的情况下,这个arrays以前能够达到250MB / s。
硬件或软件上的数周都没有改变。
无论如何,它看起来像一个硬件问题:从物理上观察arrays,我只能看到arrays中6个磁盘中的4个磁盘上的活动(闪烁的LED)。 但是,在OMSA中,arrays被报告为function齐全。 我重新启动,进入控制器的BIOS,再次,arrays是好的所有外观。 我更新了F / W到07.03.06.00 A10,这并没有帮助。
通过OMSA“闪烁”硬盘指示灯确实可以工作,所以这不仅仅是显然没有function的驱动器上的坏LED指示灯。
然后我开始对数组进行一致性检查,到目前为止还没有投诉,但是我仍然只能看到6个磁盘中的4个磁盘上的活动。
我从来没有见过这种情况,一个RAID控制器似乎停止使用2个磁盘,同时报告相同的磁盘是好的,arrays的一部分。
我的假设是我需要更换H200和/或那些磁盘。
但是,我很想知道是否有人看到过这种行为,如果有其他解决scheme的话。
有没有什么办法可以让透明的使用H200的个人磁盘的实际使用?
感谢您的时间。
编辑:这些磁盘是戴尔authentication,但他们的固件从未更新,大约在2013年。
replace两个“无响应”磁盘解决了这个问题。 两个镜像集重build,现在所有6个磁盘都适当地显示活动。 重build完成后的线性写入速度为257 MB / s,这个arrays通常应该是这样。
但是,当在USB机箱中testing时,两个“失败”的磁盘没有SMART错误,R / W速度大约为100 MB / s,这与7200 RPM SATA磁盘相当。 因此,我不能说他们失败了 ,而是控制者停止使用他们。
我没有find一种方法(在CentOS中)来监视单个磁盘的使用情况,而不是通过物理地查看LED。