什么是“大”突袭5arrays？

最近在我办公室的一个布法罗TeraStation NAS问题让我调查了Raid 5。

我发现一些不同的文章谈论不适合在大型arrays或大型磁盘中使用raid 5

以下是一个示例文章，讨论重build大型消费者驱动器arrays的问题。

我正在试图弄清楚什么是“大”？

我们在这里的NAS是4驱动器RAID 5设置，每个驱动器是1 TB。驱动器发生故障并被更换，arrays正在重build。

这个设置是否构成很大，在重build期间可能会有问题？

这种设置对于日常使用有多可靠？

devise磁盘arrays的可靠性：

find你的驱动器的URE率（制造商不喜欢谈论他们的驱动器失败，所以你可能需要挖掘find这个，它应该是1/10 ^ X其中X通常在12-18左右）。
决定什么是您的存储需求可接受的风险率†。通常情况下，出现故障的可能性小于0.5％，但在“暂存”存储中可能为几个百分点，关键数据可能小于0.1。
1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
对于具有多个奇偶校验磁盘的arrays或镜像中具有多对磁盘的镜像，请将“arrays中的驱动器”后面的1更改为具有奇偶校验/镜像的磁盘数量。

所以我有一套4个1TB的WD Green驱动器。他们有一个URE率1/10 ^ 14。我用它们作为临时存储。 1 - (1 - 1TB x 1/10^14byte) ^ 3 => 3.3%在一个驱动器死后重buildarrays失败的风险。这些对于存储我的垃圾非常棒，但是我并没有把关键数据放在那里。

_{†确定可接受的失败是一个漫长而复杂的过程。} _{它可以概括为Budget = Risk * Cost 。} _{所以如果一个失败将花费100美元，并有10％的机会发生，那么你应该有10美元的预算来防止它。} _{这大大简化了确定风险的任务，各种失败的成本以及潜在的预防技术的性质 – 但是你明白了。} _{‡ [Data Drives] = [Total Drives] - [Parity Drives] 。} _{两个磁盘镜像（RAID1）和RAID5有一个奇偶校验驱动器。} _{三个磁盘镜像（RAID1）和RAID6有两个奇偶校验驱动器。} _{使用RAID1和/或自定义scheme可能有更多的奇偶校验驱动器，但是非典型的。}

这个统计方程确实带来了一些警告：

URE率是宣传的速率，在大多数驱动器下线时通常更好。你可能会很幸运，并购买比宣传的好几个数量级的驱动器。同样，你可以得到一个死亡的驱动器。
某些生产线运行不良（运行中的许多磁盘同时出现故障），因此从不同制造批次获取磁盘有助于分散同时发生故障的可能性。
旧的磁盘更容易在重build的压力下死亡。
环境因素造成损失：
- 通常热循环的磁盘更有可能死亡（例如，定期开启/closures电源）。
- 振动可能会导致各种问题 – 请参阅YouTube上的ITvideo在磁盘arrays上大喊大叫。
“有三种谎言：谎言，该死的谎言和统计” – 本杰明·迪斯雷利

文章存在的原因是为了引起对HDD上不可恢复的误码率的关注。特别是，你便宜的“家用电脑”磁盘。他们通常有1/10 ^ 14的工厂规格。这是大约12.5TB的数据，如果你正在做一个2TB磁盘的RAID-5 …你打的很快。

这意味着你应该：

使用较小的RAID组，并接受更高的浪费空间。
使用RAID-6并接受额外的写入惩罚。（比RAID5高50％）
购买更昂贵的磁盘 – “服务器等级”的UBER规格为1/10 ^ 16，这意味着这是一个有争议的问题。（1.2PB好于12.5TB）

我通常会build议RAID-6是一般的转发方式，但是这会耗费你的性能。