RAID组中磁盘的最大数量指南?

在任何使用分条的RAID级别中,增加物理磁盘的数量通常会提高性能,但也会增加集合中任何一个磁盘出现故障的机会。 我有这样的想法,我不应该在一个给定的RAID组中使用多于6-8个磁盘,但是这更多的是传递知识,而不是经验。 任何人都可以给我一个很好的规则,其背后的原因是一组磁盘的最大数量?

    在RAID系统中build议的最大磁盘数量差别很大。 这取决于各种各样的东西:

    • 磁盘技术 SATA容许比SAS / FC更小的arrays,但是这种情况正在改变。
    • RAID控制器限制 RAID控制器本身可能具有基本的最大值。 如果它是基于SCSI的,并且每个可见磁盘都是LUN,则7/14规则成立。 如果它基于FibreChannel,它可以有多达120个或更多的可见磁盘。
    • RAID控制器处理器如果您使用任何种类的奇偶校验RAID,RAID卡中的CPU将成为您写入数据速度的限制因素。 卡的基本最大数量是 当RAID5 / 6 LUN中的驱动器出现故障时,您会看到它,因为性能下降会影响与RAID卡关联的所有LUN。
    • 总线带宽 U320 SCSI与FibreChannel一样有其自身的限制。 对于SCSI,保持不同通道上的RAID成员可以增强并行性并提高性能,如果控制器支持的话。

    对于基于SATA的RAID,如果您使用的是RAID5,则不需要超过6.5TB的原始磁盘。 经过比RAID6是一个更好的主意。 这是由于不可恢复的读取错误率。 如果数组的大小过大,丢失后arrays重build过程中出现不可恢复的读取错误的可能性越来越高。 如果发生这种情况,那很糟糕。 拥有RAID6大大减less了这种风险。 但是,近来SATA驱动器的质量一直在提高,所以这可能不会持续太久。

    arrays中的主轴数量并不令我感到担心,因为在U320上使用500GB硬盘达到6.5TB非常简单。 如果这样做,将一半驱动器放在一个通道上,另一半放在另一个通道上,这样做只是为了减less总线端的I / O争用。 SATA-2的速度是这样的,即使只有两个以最大速率传输的磁盘可以使总线/信道饱和。

    SAS磁盘的平均无故障时间(MTBF)速率比SATA要低(再一次,这种情况已经开始发生变化),所以规则在这方面不那么坚定。

    有内部使用SATA驱动器的FCarrays。 那里的RAID控制器非常复杂,这使得经验法则变得模糊。 例如,HP EVA系列arrays将磁盘分组到磁盘组中,在其上布置LUN。 控制器有针对性地将LUN的块放置在非连续的位置,并对后台的块进行负载平衡,以最大限度地减less热点。 对于多通道I / O,LUN所涉及的主轴以及处理冗余,他们为您做了很多繁重的工作。

    总而言之,磁盘的故障率不会影响RAID组中有多less个主轴的性能。 大部分。

    如果您正在寻找性能,那么理解用于将驱动器连接到arrays的互连非常重要。 对于SATA或IDE,您将分别查看每个通道1或2个(假设您正在使用具有独立通道的控制器)。 对于SCSI,这在很大程度上取决于总线拓扑。 早期的SCSI有一个设备限制,每个链(也就是每个控制器)有7个设备ID,其中一个必须是控制器本身,所以每个SCSI链可以有6个设备。 较新的SCSI技术允许接近这个数字的两倍,所以你会看到12+。 这里的关键在于所有驱动器的总吞吐量不能超过互连的容量 ,否则驱动器在性能达到最高时将“空转”。

    请记住,驱动器不是唯一的薄弱环节。 没有冗余的每个互连导致单个故障点。 如果您不相信我,请在单链SCSI控制器上设置RAID 5arrays,然后将控制器短路。 你还能得到你的数据吗? 是的,这就是我的想法。

    今天事情已经改变了一点。 驱动器在性能方面并没有提高,但是所看到的进步是非常重要的,除非您正在使用“驱动器农场”,否则性能往往不是问题,在这种情况下, 您正在讨论完全不同的基础架构这个回答/对话是没有意义的。 您可能更担心的是数据冗余。 由于几个因素,RAID 5在鼎盛时期performance不俗,但这些因素已经改变。 我想你会发现,RAID 10可能更符合你的喜好,因为它将提高额外的冗余对驱动器故障,同时提高读取性能。 写入性能会受到一定的影响,但是可以通过增加活跃频道来缓解。 因为RAID 10设置可以在两个驱动器故障(特定情况下)下仍然存在,而RAID 5arrays会简单地翻转并死亡,所以我会在任何一天通过5个驱动器的RAID 5设置来采用4个驱动器的RAID 10设置双驱动器故障。 除了提供稍微更好的冗余之外,还可以通过将镜像分成两个相等的部分来减轻“控制器作为单点故障”的情况,每个控制器只处理条带。 在发生控制器故障的情况下,您的条纹不会丢失,只有镜像效果。

    当然,这也可能是完全错误的。 您将需要考虑速度,容量和冗余之间的折衷。 就像老式的工程玩笑一样,“更便宜,更快,select任何两个”,你会发现你可以用适合你的configuration,即使它不是最佳的。

    我使用7作为“魔术”最大数量。 对我来说,在冗余空间(在这种情况下,大约14%)和重build时间(即使在重build时可用的LUN)或增加大小以及MTBF之间,这是一个很好的折衷。

    显然,在使用SAN 14磁盘机箱时,这对我来说非常有用。 我们的两个客户有10个硬盘盒,神奇的数字7减less到5个。

    总而言之,5-7为我工作。 对不起,我也没有科学数据,只有2001年以来的RAID系统经验。

    有效的最大值是RAID控制器的带宽。

    让我们说磁盘读取最大70MB /秒。 在峰值负载下,不能快速地铲除数据。 对于繁忙的文件服务器(RAID 5)或数据库服务器(RAID 10),您可以快速点击。

    SATA-2是300MB / S接口规格,SCSI Ultra 320会更加一致。 你在说6-10个磁盘,因为你不会经常碰到高峰。

    RAID 5我会说每个arrays0驱动器。 看到http://baarf.com/或类似的任何其他来源的咆哮。

    RAID 6对于每个arrays的每个热备份,我会说5个驱动器+ 1个。 更less的,你不妨做RAID 10,而且你正在推动风险因素,应该去RAID 10。

    RAID 10会尽可能高。

    RAID中的磁盘数量限制通常取决于SCSI总线上的设备数量。 一个总线上最多可以连接8或16个设备,而控制器则被视为一个设备 – 因此它是7或15个磁盘。

    因此,有很多RAID是7个磁盘(一个是热备份),这意味着剩下6个磁盘 – 或者14个磁盘和1个热备份。

    所以RAID组中的磁盘最大的问题可能是你需要多lessIOPS。

    例如,一个10k RPM的SCSI磁盘可能运行大约200 IOPS – 如果你有7个在RAID 5中 – 你将失去1个磁盘的奇偶校验,但有6个磁盘读/写和理论最大值1200 IOPS – 如果你需要更多的IOPS – 增加更多的磁盘(每个磁盘200 IOPS)。

    而更快的磁盘15k RPM SAS可能会达到250 IOPS等等。

    然后总是有固态硬盘(每个磁盘30,000 IOPS),他们是可以raidable(尽pipe真的很贵)。

    而且我认为SAS在设备数量方面具有疯狂的最大价值,比如16000个硬盘

    使用RAID6和SATA,我已经在11个磁盘上取得了不错的成绩…而一个热备份(一些坏的控制器需要两个热备份来重buildRAID6)。 这很方便,因为很多JBOD都是由12个硬盘组成的,比如HP MSA60。

    直到你在链条(raid卡,链接)的较窄点上达到公交车最高速度,所以它是有道理的。 将大量的1GbE网卡添加到PCI总线时也是如此,没有任何意义。