HP Proliant G6报告失败的SSD驱动器 – 监测的替代策略?

我想得到你对我在几天前发现的一个有争议的情况的反馈。 我的任务是使用HP Proliant G6进行开发,在RAID1configuration中使用2个新的(<2个月,从未使用过的) 非HP SSD。 它们被用于密集的开发任务(每天大约500GB); 在RAID5中也有常规的硬盘,但我们将在这里讨论RAID1arrays。

  • 三星SSD 840 PRO系列
  • PLEXTOR PX-256M5Pro

这两个smartctl输出可在这里: https ://gist.github.com/anonymous/cf8a5208a7315440f796

相关的过去的问题

Plextor车道一直受到报道的过热情况的影响,我认为这是由于它不是一个原始的部分

偶尔服务器重启之后,我看到有一次RAID1被重build,无法解释原因。

失败事件

前几天Plextor磁盘被报告在一个普通的“失败”状态: physicaldrive 1I:1:1 (port 1I:box 1:bay 1, Solid State SATA, 256.0 GB, Failed)

假阳性?

因此,我拔掉了它,检查了SMART输出并进行了全面testing(请参阅上面的smartctl输出)。 testing通过,甚至更糟的座椅后面的驱动器提供了一个完美的functionRAID1arrays。

这很尴尬。

替代监测?

我不知道如何让P410i告诉我“失败”状态的具体原因是什么(我认为这是不可能的),而且我知道这些是非原创的惠普部件(从而使我的付费惠普支持失效),但对于这个非关键任务服务器,我想看看是否仍有可能继续使用非惠普磁盘,并仍然对其健康状况进行某种监控

你有什么意见? 我有3个问题:

  • HP控制器的监控状态是否仅在与原装部件一起使用时才受信任? (这很容易)
  • 客观上这些(完全不是高质量的)SSD是否健康?
  • 我应该对SMARTtesting的结果给予100%的信任吗?

提前致谢

您的SSD可能是健康的,但HP Smart Array P410 RAID控制器与每个 SSD都不兼容。

特别是,一些SSD会向控制器报告不正确的温度属性,导致机箱风扇和系统散热问题。 此外,该控制器上使用的任何SATA设备将从6Gbps降至3Gbps速度 。 所以你失去了带宽的潜力。

显然,这些组件的组合是不匹配的。 您可以使用专用控制器(HP品牌的Sandisk / Pliant / Intel / Samsung / STEC)使用已知好的SSD,也可以尝试使用第三方驱动器,直到find可用的驱动器为止。 我推荐英特尔和OWC。

我已经介绍了一些在这里运行良好的驱动器选项:

SSD驱动器与机械驱动器(2013)一样可靠吗?

和这里:

惠普存储arrays – 多个渠道?