多个服务器,12小时内发生多个驱动器故障?

在IT界,我刚刚赢得了彩票两次…

今天我们有一个RAIDarrays的硬盘驱动器失败。 几个小时后,我们有另一个驱动器在另一台服务器上失败….我们开始立即检查所有的环境日志和系统。 湿度为40%,温度为75℃,没有灰尘或其他颗粒飞散。 我们检查了UPS日志,没有报告高峰。 大约3小时后,另一个硬盘驱动器在第三个系统上失败….

要概括3 HP DL380 G7,这些服务器都是连续的序列号。 虽然我敢打赌arrays控制器和电路板是不一样的。 惠普将在早上出来….同时,我们希望这不成为一个习惯…我们在这整个服务器机架在2.5年内有1驱动器故障。 今天3个12小时内!

我们还应该寻找什么? 有没有其他人有类似的问题?

任何帮助是极大的赞赏。 这个事件消耗了我们的备件….如果我们有另一个失败,我们将寻找惠普交换他们。

更新:这些是146 GB 10k rpm SAS驱动器和一个300 GB 10k rpm SAS驱动器。 惠普原装设备。

这些事情发生了…你会惊讶我所看到的规模相同的设备。

你做了正确的检查你的环境ESD ,温度和功率问题。

作为ProLiant DL380 G7设备,arrays控制器embedded在系统板上。 批号不会太紧。 我不认为这是巧合。 但是,对于某些固件更新来说,这可能是个好时机,因为错误的驱动器故障有时是不良修订的症状。

既然你有支持,让惠普处理零件/更换,并继续前进:)

顺便说一句 – 这将有助于详细介绍驱动器的容量和types(SAS,SATA,近线SAS)