RAID硬盘预防性更换

从经验中我了解到每一个硬盘都会失败,这只是一个时间问题。

我以艰辛的方式吸取教训,现在我做了备份。

当我换新驱动器时,我经常将保修期内的驱动器列表隔离。 硬盘制造商在那里赚钱,显然,大多数时候,他们devise的硬盘驱动器至less保证期。 那么在那段时间之后,我预计失败率会更大。 我已经有3个RAID 3的驱动器几乎同时失败(第二个驱动器失败时重buildarrays,是的,我有一个最近的备份)。

我的问题是:保修后在RAID中预防性更换硬盘的最佳做法是什么?

你在乎吗? arrays中有多less个驱动器可以replace?


答复的注意事项
创build新arrays时:使用来自不同制造商/批次的驱动器。
当已经有一个旧的arrays时:添加一个新的备用。

这取决于你是在谈论服务器级的装备还是桌面级的装备。

如果是用自己的钱和现成的驱动器构build的台式机,并且您不担心兼容性,那么是的,您的策略是正确的。 每X年,出去购买全新的驱动器,以取代目前的驱动器。 他们会更快,更安静,更大。 您可以单独更换驱动器,让arrays自行重build,然后在重build完成后重新configurationarrays以使其更大。 (不是所有的RAID适配器都支持这样的操作 – 在线重build和大小更改。)

如果它是像HP Proliant或IBM System X这样的服务器级机器,则会变得更加复杂。 您可能需要在兼容性列表中使用RAID驱动器。 在这种情况下,驱动器将会很昂贵,因为它们可能已经不再生产,或者它们只是在服务器级别的东西上开始时很昂贵。 更糟的是,您可能会从您的经销商购买翻新设备,而不知道这一点 – 这对服务器经销商来说并不less见。

另外,您可能会丢弃寿命完美的驱动器,并将其replace为注定要发生故障的驱动器。 而不是积极地取代这些,更有意义的是build立一个热备用服务器开始,并确保您的RAIDarrays支持使用热备份自动重build。 然后,在您下床之前重build将进入数据中心,您可以在闲暇时更换死硬盘,而无需花费金钱和时间。

谷歌对硬盘故障率的研究表明,与以前的怀疑相比,与年龄的相关性更小。 我听到的最好的build议是避免从一个批次或一个制造商创build磁盘arrays。 Google的研究表明,类似的制造批次的驱动器同时出现故障之间有很强的相关性。

如果您担心RAID数据集的可靠性,我强烈build议转移到RAID10,否则将失败RAID6。

考虑到每GB读取的MTBF和错误率,在重build劣化的RAID5集合时出现双重故障的机会对于当今市场上的TB级驱动器的舒适度而言太高。 ref http://hardware.slashdot.org/hardware/08/10/21/2126252.shtml

我会同意100%与同一批驱动器都失败紧密在一起。 我有10个戴尔工作站,4年后,我有6个驱动器都失败了12个月的对方。

通过生产服务器,我总是从戴尔这样的地方购买产品,并确保他们至less要备份备件,以保证服务器的运行时间,通常是4年。

我有3台服务器与RAID的驱动器失败了我。 我从来没有热备件,但戴尔第二天让我replace,重build很快完成。 加上适当的备份,你应该没问题。

你可以尝试使用raid6。 它可以存活2个磁盘失败,一定要有一个热备份磁盘。