大型驱动器的高故障率？

我最近部署了一个5x 1TB硬盘的服务器（我不会提到他们的品牌，但它是最大的一个）。我最初被警告不要使用大容量硬盘，因为一位朋友告诉我他们的平均无故障时间（MTBF）非常低，而且我会更好地获得更多容量更小的硬盘，因为它们不会因为什么而被“推到极限”技术可以处理。

此后，五个磁盘中的三个失败了。谢天谢地，我能够在下一张磁盘失败之前更换和重buildarrays，但是让我非常担心。

你怎么看？我是不是把他们弄糟了？或者更新/更高容量的磁盘比已经过testing的磁盘更容易失败？

你可能有一个不好的批次。由于这个原因，我对使用同一批次的磁盘构buildarrays感到紧张 – 它们很可能会有相似的寿命，这使得在失败的时候获得replace可能会非常激动人心。

驱动器有一些devise缺陷并不是不可能的，这绝对是以前发生的; 然而，通常情况下，互联网充斥着关于驱动器的抱怨，如果确实有什么问题，而不是通常会发现的任何背景噪音。

除非拥有大型组织的资源，否则这是一个难以回答的问题。查看Google对硬盘故障的研究。

在大量购买磁盘时，我将以最低的每字节成本来确定粗略的磁盘大小，这通常比最新的要旧一代。这是有道理的，他们会提高这一代的可靠性。

更多的盘片+更多的头等于失败的可能性更高。

以两个普通的WD硬盘驱动器

640GB =两个盘片
1TB =三盘

WD Black 640GB vs 1TB comparison Drive Ready Time 11 sec 13 R/W Power watts 8.3 8.4 Idle Power watts 7.7 7.8 Standby watts 1 1 Max shock 300g 250g Performance seek 29 33 Quiet seek 26 29

额外的拼盘=更多的噪音，更多的电力使用，更多的热量，更慢的驾驶准备时间，更容易受到震动损坏，以及更多的振动。

如果他们只用一个盘就可以制作相同的驱动器devise，那么它的规格会更好。在这种情况下，这些消费级驱动器，但他们是高端消费级驱动器的双caching和5年保修。如果仔细检查任何品牌或风格的传统硬盘（旋转盘）的文档，您会看到类似的math。更多的盘片使驱动器不太可靠，纯粹是物理问题。

杰夫亨斯巴赫说的也是对的

“大”驱动器主要关心的是发生故障时的重build时间。驱动器越大，重build时间越长，驱动器故障和arrays可能丢失的窗口就越大。对于“大”驱动器，可用性的商业价值应该决定可以接受的风险（arrays损失）的水平，这将推动您的RAID级别select和驱动器数量（更多驱动器=更多驱动器故障的机会）。

join一些小剂量的Graeme Perrow

一个拥有五千万行业的行业，与拥有五百万行业的行业相比，拥有一个坏行业的机会是十倍。我假设大驱动器和小驱动器的故障率在这里是相同的，这可能不是一个好的假设

更多的盘片=糟糕
更多的存储空间是一个混合包。优点和缺点是很多的。
更多的行业真的是更多的错误的机会。不一定是线性的，但肯定是一个因素。

除非你需要比可靠性更多的空间，否则我会build议坚持单碟或双碟碟机。需要研究，有时甚至可能知道订购驱动器时会得到什么样的结果，因为有些制造商不仅要避免发布在同一零件编号下销售多于一个驱动器的盘片数量。

举个例子，WD3200AAKS有一个单碟320GB版本和一个双碟320GB版本（160GB×2）。最重要的是，有多个标签和驱动器shell正在使用，所以你不能容易地看驱动器，并知道哪个盘子里面。要知道的唯一方法是在网上search，知道WD3200AAKS-00B3A0和WD3200AAKS-75VYA0告诉你哪个是单碟，但没有零售商会告诉你，你会得到。

我相信高于正常的失败率是任何新技术的指示。我总是被告知永远不要购买汽车的第一年，等到他们发现错误。我想说，同样的事情可能适用于许多其他的事情，包括硬盘驱动器。

我不确定说“大”磁盘的平均无故障时间是否合理。我有一个750GB的驱动器的大名称系统，在过去2年以上没有任何失败（750年是2年前的“大”）。但是我也知道当250GB大的时候build立一个大的名字系统，而且这个arrays已经倒了好几次了。 MTBF的辩论是一场神圣的战争。

“大”驱动器主要关心的是发生故障时的重build时间。驱动器越大，重build时间越长，驱动器故障和arrays可能丢失的窗口就越大。对于“大”驱动器，可用性的商业价值应该决定可以接受的风险（arrays损失）的水平，这将推动您的RAID级别select和驱动器数量（更多驱动器=更多驱动器故障的机会）。

业务SATA / RAID在过去几年中已经出现。如果他们知道这将是一个主要的支持问题或客户失望的来源，我不认为大名将提供。我很想知道你的可靠性，现在你已经replace了一些原始的批次。

他们都在同一台计算机或磁盘控制器上？你说过你必须重build数组。如果是这种情况，那么可能是控制器，电源或内存有问题 。如果没有，我也会猜测错误的一批驱动器。另外，无论您使用哪个特定控制器，都可能存在兼容性问题。

另外，我想知道人们何时会说更大的磁盘具有更高的平均故障间隔时间（MTBF）如何计算。比方说你有2×250 GB和1×500 GB的磁盘。也许这是天真的，但不是那个拥有两倍数据的驱动器可能会失败吗？我想我不知道MTBF是否包含任何误读或错误写入，或者是否意味着磁盘机械损坏。有谁知道硬盘是否有严格的行业标准和MTBF定义？

以下是我要检查的一些事情：1）驱动器上的序列号是否非常接近？如果是这样，你可能有一个错误的批次2）你的服务器所处的环境如何？您最近是否遇到其他硬件故障？ 3）驱动器是否是希捷酷鱼驱动器？这些驱动器有问题。看到这个计算机世界的文章。 4）这些驱动器是否是系统的一部分？或者你自己买了吗？如果您购买了OEM驱动器，则在购买驱动器之前无法确保驱动器处理得当。

我个人有难以置信的运气与硬盘驱动器。我只有两个驱动器在我身上失败。其中只有一个故障发生在我实际使用的驱动器上。但是，在我身边，我看到很多人丢失了硬盘上的数据。

大型驱动器的较高故障率可能只是驱动器大小的一个函数。一个拥有五千万行业的行业，与拥有五百万行业的行业相比，拥有一个坏行业的机会是十倍。我假设大驱动器和小驱动器的故障率在这里是相同的，这可能不是一个好的假设 – 正如其他人所说的，事实上TB级驱动器还是比较新的，它们的故障率可能更高首先。

在你的情况下，它听起来像一批坏的驱动器。

如果你从同一个地方同时购买了所有的驱动器，那么它们都可能来自一个批次。

在组build一个RAIDarrays时，我通常build议将驱动器混合一点，即混合制造商或至less来自不同供应商的驱动器（以降低所有驱动器来自不良批次的风险）。

我想提出的另一个build议是尽可能使用更小的驱动器（也就是说，驱动器和控制器端口有物理空间来挂起它们），所以RAID 1或两个1Tb驱动器不是RAID 4而是4个500Gb单元。这样，当一个驱动器坏了，你只重build一个较小的arrays，而不是重build整个arrays（减lessarrays不完整的时间长度）的一部分，而且它还提供了更多的冗余（在“两个驱动器同时出现故障”的六个中的四个中，四个驱动器RAID10arrays将存活）。如果您的RAID控制器/软件支持，也可以将较小的R5arrays组合成一个R50arrays。

也许我太偏执了，但是我会担心信任1TB的数据到单个驱动器，即使这个驱动器是冗余arrays的一部分。

很明显，这里有物理上的限制，可能会使得这个技术对你来说不切实际，也会造成功耗限制，所以YMMV。作为一个“例如”当一个arrays或arrays是不实际的：我宁愿有四个驱动器R10在我们的服务器之一，而不是R1arrays中的较大的驱动器，但它没有物理上有空间，购买/构build外部arrays的成本已经超出预算，而且由于数据保护要求，数据必须与所有其他数据保持物理分离，因此我们无法使用现有arrays上的空间。

有人对这个大驱动器的问题做了非常详细的研究。即使驱动器尺寸增加，误码率仍然保持恒定，再加上重build较大驱动器所需的时间也较长。二者结合起来将重build期间的第二次失败置于现实的境地。我会在RAIDarrays上使用500 GB或更小的驱动器。

始终使用容量较小的硬盘驱动器进行生产。从来没有检查过它后面的物理，但较小的磁盘往往不太经常打破。这就是大家总是告诉我的。

你是否用同一批次的磁盘创build了一个arrays，并且都是从同一个供应商发货的？我被告知这是一件坏事…

考虑RAID-6。在RAID-5重build过程中出现硬读错误的可能性非常大。或使用ZFS的RAID-Z。