什么是“大”突袭5arrays?

最近在我办公室的一个布法罗TeraStation NAS问题让我调查了Raid 5。

我发现一些不同的文章谈论不适合在大型arrays或大型磁盘中使用raid 5

以下是一个示例文章 ,讨论重build大型消费者驱动器arrays的问题。

我正在试图弄清楚什么是“大”?

我们在这里的NAS是4驱动器RAID 5设置,每个驱动器是1 TB。 驱动器发生故障并被更换,arrays正在重build。

这个设置是否构成很大,在重build期间可能会有问题?

这种设置对于日常使用有多可靠?

devise磁盘arrays的可靠性:

  1. find你的驱动器的URE率(制造商不喜欢谈论他们的驱动器失败,所以你可能需要挖掘find这个,它应该是1/10 ^ X其中X通常在12-18左右)。
  2. 决定什么是您的存储需求可接受的风险率†。 通常情况下,出现故障的可能性小于0.5%,但在“暂存”存储中可能为几个百分点,关键数据可能小于0.1。
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    对于具有多个奇偶校验磁盘的arrays或镜像中具有多对磁盘的镜像,请将“arrays中的驱动器”后面的1更改为具有奇偶校验/镜像的磁盘数量。

所以我有一套4个1TB的WD Green驱动器。 他们有一个URE率1/10 ^ 14。 我用它们作为临时存储。 1 - (1 - 1TB x 1/10^14byte) ^ 3 => 3.3%在一个驱动器死后重buildarrays失败的风险。 这些对于存储我的垃圾非常棒,但是我并没有把关键数据放在那里。

†确定可接受的失败是一个漫长而复杂的过程。 它可以概括为Budget = Risk * Cost 所以如果一个失败将花费100美元,并有10%的机会发生,那么你应该有10美元的预算来防止它。 这大大简化了确定风险的任务,各种失败的成本以及潜在的预防技术的性质 – 但是你明白了。 [Data Drives] = [Total Drives] - [Parity Drives] 两个磁盘镜像(RAID1)和RAID5有一个奇偶校验驱动器。 三个磁盘镜像(RAID1)和RAID6有两个奇偶校验驱动器。 使用RAID1和/或自定义scheme可能有更多的奇偶校验驱动器,但是非典型的。


这个统计方程确实带来了一些警告:

  • URE率是宣传的速率,在大多数驱动器下线时通常更好。 你可能会很幸运,并购买比宣传的好几个数量级的驱动器。 同样,你可以得到一个死亡的驱动器。
  • 某些生产线运行不良(运行中的许多磁盘同时出现故障),因此从不同制造批次获取磁盘有助于分散同时发生故障的可能性。
  • 旧的磁盘更容易在重build的压力下死亡。
  • 环境因素造成损失:
    • 通常热循环的磁盘更有可能死亡(例如,定期开启/closures电源)。
    • 振动可能会导致各种问题 – 请参阅YouTube上的ITvideo在磁盘arrays上大喊大叫 。
  • “有三种谎言:谎言,该死的谎言和统计” – 本杰明·迪斯雷利

文章存在的原因是为了引起对HDD上不可恢复的误码率的关注。 特别是,你便宜的“家用电脑”磁盘。 他们通常有1/10 ^ 14的工厂规格。 这是大约12.5TB的数据,如果你正在做一个2TB磁盘的RAID-5 …你打的很快。

这意味着你应该:

  • 使用较小的RAID组,并接受更高的浪费空间。
  • 使用RAID-6并接受额外的写入惩罚。 (比RAID5高50%)
  • 购买更昂贵的磁盘 – “服务器等级”的UBER规格为1/10 ^ 16,这意味着这是一个有争议的问题。 (1.2PB好于12.5TB)

我通常会build议RAID-6是一般的转发方式,但是这会耗费你的性能。