只是一个简单的问题:是否有理由在发生故障之前x年更换服务器的硬盘驱动器(最终会在某个时间点),还是应该保留它直到出现故障? 我对实际的服务器pipe理有一点经验,所以我想知道
改变它的一个很好的理由是,如果你想把另一个任务添加到你要做的事情列表中,同时增加发生错误的可能性。
除了所有的开玩笑,我没有任何理由提前改变车道。 如果你有RAID,那么你已经有了保护措施(假设你有很好的备份),而且你不会产生废弃的硬盘来处理,而且你也不必在消除来自驱动器的敏感数据。 您不会在新驱动器上花费额外的金钱,而且您仍然不会主动防范可能仍会出错的事情,比如故障驱动器控制器,这种驱动器故障并不常见,但可以发生。
另一方面,这可能会帮助您发现在RAID单元上不会触发警报的不可恢复的驱动器错误,就像我们在RAID 5中发生的一样。我们被这个问题困住了,最终需要从备份裸机重build(所以甚至在这种情况下,正确的备份将帮助您恢复。)考虑到当今较大的驱动器容量和不可恢复的容错能力,RAID级别将有助于我们(如果不是)备份节省时间。
大多数pipe理员有一个体面的RAID和备份计划,所以没有必要通过无谓地更换驱动器来产生额外的浪费。
我都是积极主动的,但我从来没有做过,也从来没有听说过有人这样做。 想必你有一些types的RAID设置,并定期发生有问题的系统的有效备份。
我唯一可能考虑的是,如果我有一堆来自同一批次的磁盘,并且批处理中的其他磁盘出现故障,那么我可能会考虑这个问题。
如果我在空间上紧张的话,那么我肯定会这么做 – 但除了因为年龄的增长,没有别的原因吗? 不是,因为第一年的平均故障率与其他年份的故障率相似 。 (注意,图表在第一年超过3个月,6个月,1年,但是你必须把它们加在一起,以便在1年内有失败的机会)。 而当考虑高磁盘利用率时,第一年更有可能比第三年的总和还要多。
后期驾驶失败的唯一相关是在较热的房间,我们保持我们的服务器室凉爽。
是的,性能和容量。 如果旧硬盘的读取速度为70MB /秒,IOPS为100,潜在的替代品可以达到200MB /秒的持续读取量和175 IOPS,同时拥有3倍的容量,您可能有理由购买新硬盘,性能/容量的原因。 (这些数字是完全组成的,重点是更新可以显着更快)。
现在你用旧的硬盘怎么办? 您可以在testing服务器中使用它们,或者将它们添加到磁盘arrays的备份中,或者作为紧急备件保存。 或者你可以把它们擦干净,然后把它们送去处理。
你的平均服务器现在的日子是IO绑定更多的是处理器绑定(或至less我的全部)。 所以,如果你有一个真正的老服务器,没有CPU时间或内存不足的问题,你可能有空间来显着提高性能,取代你可以轻松购买几代的硬盘来代替它们。
这取决于硬盘故障的影响。
如果你没有RAID
如果您不关心服务器的可用性,因为服务可能被停用,或者因为服务器处于高可用状态,并且您有数据的工作备份。 我会说,好的,让驱动器死亡,改变它,恢复数据,当它会失败。
如果你关心可用性,我会说使用RAID;)
如果您有RAID(1,5,6,…)
我会说,为什么在故障之前更换硬盘? RAID(和备份)就在这里。 更换一个硬盘驱动器,以防万一它可能会失败是一个破坏的风险(袭击重build总是风险)
但这只是我的观点! 如果你认为你的驱动器可能太老了,你可能也想更换你的服务器。
有些磁盘会在1小时内死亡,其他磁盘则会持续2年。
如果它没有失败或失败(通常可以通过SMART监视或性能问题build立的东西),那么唯一的原因是如果它不够大或不足以达到您的目的。
使用磁盘,问题不在于它们是否会失败,而在于何时 。 他们是机械设备(除非使用SSD,但他们有自己的警告),所以他们迟早会失败。
磁盘供应商倾向于将他们的制造工艺定制为尽可能便宜,因为当您生产和销售数以千计的磁盘时,每个磁盘节省一分钱就相当重要; 但他们当然不希望他们的磁盘在保修期结束之前失效,或者他们一直在免费更换它们; 所以,他们会很高兴地花费尽可能多的时间,只要保证涵盖他们,但不会多花一分钱。
最终的结果是:大多数磁盘在保修期结束后很快就会失效。 这当然不是一个通用规则,只是统计数据,你的磁盘现在可能会失败或持续下去,直到你不再需要它为止。但从统计上来看,有很多磁盘在数天或数月之后保修期满。
当然,如果你不需要它们,购买新的产品可能代价高昂,但是在保修到期后更换它们,否则失败将会代价高昂。
现在,如果你能find一种方法来保证它们在失败的同时又不会丢失数据(比如RAID 和备份),那么这将是最佳select;-)
我不会更换一个工作驱动器比我更换一个工作电源。 两者最终都会失败,但无论从技术上还是经济上来说,毫无意义地取代它们是没有意义的。 当他们开始显示麻烦的迹象时将其replace。
在硬盘驱动器的情况下,趋势是,如果驱动器将提前失败,第一年可能会这样做。 通常可以依靠无故障运行6年的驱动器继续工作至less几年。 显然有很多例外,但这是大势所趋。
此外,请记住,大多数服务器级驱动器的制造要求更为严格,通常比低成本/预算的台式机驱动器更可靠。 所以,除了在可能失败的情况下更换“好的”驱动器的危险之外,对于大型arrays来说这样做可能会产生大量的资金。
而且,在使用RAID时,这就是为什么在服务器中至less有一个热备份是一个好主意,所以它可以很快开始重build并保持健康,直到您根据需要购买replace品。
我已经在“零宕机”系统上完成了。 实际上,当RAID重build时,你可能会失去另一个驱动器…我换了一次,然后在重build期间另一个驱动器开始抛出错误时将其交换回来。
这真的是一个哲学问题:如果你相信积极的压力testing(arrays和心血pipe系统),那么你应该换掉你的驱动器。 但是,真的,你永远不会知道下一个驱动器会变坏。 在丢失任何较旧的,经过validation的驱动器之前,不可能丢失新更换的驱动器。
这就是说,我会浪费我的时间在压力testing我的备份解决scheme,并保持驱动器的和平,直到他们开始真正抛出错误。