RAID硬盘预防性更换

从经验中我了解到每一个硬盘都会失败，这只是一个时间问题。

我以艰辛的方式吸取教训，现在我做了备份。

当我换新驱动器时，我经常将保修期内的驱动器列表隔离。硬盘制造商在那里赚钱，显然，大多数时候，他们devise的硬盘驱动器至less保证期。那么在那段时间之后，我预计失败率会更大。我已经有3个RAID 3的驱动器几乎同时失败（第二个驱动器失败时重buildarrays，是的，我有一个最近的备份）。

我的问题是：保修后在RAID中预防性更换硬盘的最佳做法是什么？

你在乎吗？ arrays中有多less个驱动器可以replace？

答复的注意事项
创build新arrays时：使用来自不同制造商/批次的驱动器。
当已经有一个旧的arrays时：添加一个新的备用。

这取决于你是在谈论服务器级的装备还是桌面级的装备。

如果是用自己的钱和现成的驱动器构build的台式机，并且您不担心兼容性，那么是的，您的策略是正确的。每X年，出去购买全新的驱动器，以取代目前的驱动器。他们会更快，更安静，更大。您可以单独更换驱动器，让arrays自行重build，然后在重build完成后重新configurationarrays以使其更大。（不是所有的RAID适配器都支持这样的操作 – 在线重build和大小更改。）

如果它是像HP Proliant或IBM System X这样的服务器级机器，则会变得更加复杂。您可能需要在兼容性列表中使用RAID驱动器。在这种情况下，驱动器将会很昂贵，因为它们可能已经不再生产，或者它们只是在服务器级别的东西上开始时很昂贵。更糟的是，您可能会从您的经销商购买翻新设备，而不知道这一点 – 这对服务器经销商来说并不less见。

另外，您可能会丢弃寿命完美的驱动器，并将其replace为注定要发生故障的驱动器。而不是积极地取代这些，更有意义的是build立一个热备用服务器开始，并确保您的RAIDarrays支持使用热备份自动重build。然后，在您下床之前重build将进入数据中心，您可以在闲暇时更换死硬盘，而无需花费金钱和时间。

谷歌对硬盘故障率的研究表明，与以前的怀疑相比，与年龄的相关性更小。我听到的最好的build议是避免从一个批次或一个制造商创build磁盘arrays。 Google的研究表明，类似的制造批次的驱动器同时出现故障之间有很强的相关性。

如果您担心RAID数据集的可靠性，我强烈build议转移到RAID10，否则将失败RAID6。

考虑到每GB读取的MTBF和错误率，在重build劣化的RAID5集合时出现双重故障的机会对于当今市场上的TB级驱动器的舒适度而言太高。 ref http://hardware.slashdot.org/hardware/08/10/21/2126252.shtml

我会同意100％与同一批驱动器都失败紧密在一起。我有10个戴尔工作站，4年后，我有6个驱动器都失败了12个月的对方。

通过生产服务器，我总是从戴尔这样的地方购买产品，并确保他们至less要备份备件，以保证服务器的运行时间，通常是4年。

我有3台服务器与RAID的驱动器失败了我。我从来没有热备件，但戴尔第二天让我replace，重build很快完成。加上适当的备份，你应该没问题。