是否有理由在故障之前更换服务器的硬盘驱动器？

只是一个简单的问题：是否有理由在发生故障之前x年更换服务器的硬盘驱动器（最终会在某个时间点），还是应该保留它直到出现故障？我对实际的服务器pipe理有一点经验，所以我想知道

改变它的一个很好的理由是，如果你想把另一个任务添加到你要做的事情列表中，同时增加发生错误的可能性。

除了所有的开玩笑，我没有任何理由提前改变车道。如果你有RAID，那么你已经有了保护措施（假设你有很好的备份），而且你不会产生废弃的硬盘来处理，而且你也不必在消除来自驱动器的敏感数据。您不会在新驱动器上花费额外的金钱，而且您仍然不会主动防范可能仍会出错的事情，比如故障驱动器控制器，这种驱动器故障并不常见，但可以发生。

另一方面，这可能会帮助您发现在RAID单元上不会触发警报的不可恢复的驱动器错误，就像我们在RAID 5中发生的一样。我们被这个问题困住了，最终需要从备份裸机重build（所以甚至在这种情况下，正确的备份将帮助您恢复。）考虑到当今较大的驱动器容量和不可恢复的容错能力，RAID级别将有助于我们（如果不是）备份节省时间。

大多数pipe理员有一个体面的RAID和备份计划，所以没有必要通过无谓地更换驱动器来产生额外的浪费。

我都是积极主动的，但我从来没有做过，也从来没有听说过有人这样做。想必你有一些types的RAID设置，并定期发生有问题的系统的有效备份。

我唯一可能考虑的是，如果我有一堆来自同一批次的磁盘，并且批处理中的其他磁盘出现故障，那么我可能会考虑这个问题。

如果我在空间上紧张的话，那么我肯定会这么做 – 但除了因为年龄的增长，没有别的原因吗？不是，因为第一年的平均故障率与其他年份的故障率相似。（注意，图表在第一年超过3个月，6个月，1年，但是你必须把它们加在一起，以便在1年内有失败的机会）。而当考虑高磁盘利用率时，第一年更有可能比第三年的总和还要多。

后期驾驶失败的唯一相关是在较热的房间，我们保持我们的服务器室凉爽。

是的，性能和容量。如果旧硬盘的读取速度为70MB /秒，IOPS为100，潜在的替代品可以达到200MB /秒的持续读取量和175 IOPS，同时拥有3倍的容量，您可能有理由购买新硬盘，性能/容量的原因。（这些数字是完全组成的，重点是更新可以显着更快）。

现在你用旧的硬盘怎么办？您可以在testing服务器中使用它们，或者将它们添加到磁盘arrays的备份中，或者作为紧急备件保存。或者你可以把它们擦干净，然后把它们送去处理。

你的平均服务器现在的日子是IO绑定更多的是处理器绑定（或至less我的全部）。所以，如果你有一个真正的老服务器，没有CPU时间或内存不足的问题，你可能有空间来显着提高性能，取代你可以轻松购买几代的硬盘来代替它们。

这取决于硬盘故障的影响。

如果你没有RAID
如果您不关心服务器的可用性，因为服务可能被停用，或者因为服务器处于高可用状态，并且您有数据的工作备份。我会说，好的，让驱动器死亡，改变它，恢复数据，当它会失败。
如果你关心可用性，我会说使用RAID;）

如果您有RAID（1,5,6，…）
我会说，为什么在故障之前更换硬盘？ RAID（和备份）就在这里。更换一个硬盘驱动器，以防万一它可能会失败是一个破坏的风险（袭击重build总是风险）

但这只是我的观点！如果你认为你的驱动器可能太老了，你可能也想更换你的服务器。

有些磁盘会在1小时内死亡，其他磁盘则会持续2年。

如果它没有失败或失败（通常可以通过SMART监视或性能问题build立的东西），那么唯一的原因是如果它不够大或不足以达到您的目的。

使用磁盘，问题不在于它们是否会失败，而在于何时。他们是机械设备（除非使用SSD，但他们有自己的警告），所以他们迟早会失败。

磁盘供应商倾向于将他们的制造工艺定制为尽可能便宜，因为当您生产和销售数以千计的磁盘时，每个磁盘节省一分钱就相当重要; 但他们当然不希望他们的磁盘在保修期结束之前失效，或者他们一直在免费更换它们; 所以，他们会很高兴地花费尽可能多的时间，只要保证涵盖他们，但不会多花一分钱。

最终的结果是：大多数磁盘在保修期结束后很快就会失效。这当然不是一个通用规则，只是统计数据，你的磁盘现在可能会失败或持续下去，直到你不再需要它为止。但从统计上来看，有很多磁盘在数天或数月之后保修期满。

当然，如果你不需要它们，购买新的产品可能代价高昂，但是在保修到期后更换它们，否则失败将会代价高昂。

现在，如果你能find一种方法来保证它们在失败的同时又不会丢失数据（比如RAID 和备份），那么这将是最佳select;-)

我不会更换一个工作驱动器比我更换一个工作电源。两者最终都会失败，但无论从技术上还是经济上来说，毫无意义地取代它们是没有意义的。当他们开始显示麻烦的迹象时将其replace。

在硬盘驱动器的情况下，趋势是，如果驱动器将提前失败，第一年可能会这样做。通常可以依靠无故障运行6年的驱动器继续工作至less几年。显然有很多例外，但这是大势所趋。

此外，请记住，大多数服务器级驱动器的制造要求更为严格，通常比低成本/预算的台式机驱动器更可靠。所以，除了在可能失败的情况下更换“好的”驱动器的危险之外，对于大型arrays来说这样做可能会产生大量的资金。

而且，在使用RAID时，这就是为什么在服务器中至less有一个热备份是一个好主意，所以它可以很快开始重build并保持健康，直到您根据需要购买replace品。

我已经在“零宕机”系统上完成了。实际上，当RAID重build时，你可能会失去另一个驱动器…我换了一次，然后在重build期间另一个驱动器开始抛出错误时将其交换回来。

这真的是一个哲学问题：如果你相信积极的压力testing（arrays和心血pipe系统），那么你应该换掉你的驱动器。但是，真的，你永远不会知道下一个驱动器会变坏。在丢失任何较旧的，经过validation的驱动器之前，不可能丢失新更换的驱动器。