RAID:在失败之前更换磁盘

我们有一个RAID 5设置(MegaRAID SAS ROMB),带有4个930 Gb物理磁盘,以2.7 TB VD运行。 最近(几个月前),我们有一个驱动器故障,不得不把它放在退化模式多年(各种因素,希望我们没有,但它不在问题的范围)。 我们更换了磁盘并重build。 最近几周,我们注意到其中一个物理磁盘上存在持续的未收回媒体错误 – 基本上与第一次失败之前相同的错误频繁发生(大约每分钟发生5次,每次事件发生4-8次错误) 。 值得庆幸的是,预算现在在一个更好的地方,所以我们有一个更换磁盘准备好了。

唯一的问题,在这里,我唯一的新东西是,我们正在执行一个arrays上的步骤,就MegaRAID存储pipe理器而言,它仍然是最佳的。 在这个地方有很多信息可以替代退化arrays中的磁盘(更不用说我只是重复我之前做过的同样的步骤),但是我无法主动find任何额外的信息,在驱动器失败之前。

我相信这个过程本质上是一样的,还有一个额外的步骤,但如果我错过了这个标记,我会非常感激的。

  1. 在存储pipe理器中,将相应的物理磁盘标记为离线(如果我的磁盘的右端,则会导致VD进入降级模式)

  2. closures电脑

  3. 更换驱动器

  4. 打开电脑

  5. 开始重build

现在,我有多糟糕的步骤呢? (这可能值得注意,而且是我这里双重检查的原因,电脑问题也是DC)

这些年来,我pipe理/毁坏了许多RAID 5arrays,而且在处理这种情况时,我总是大呼过瘾。 你应该能够采取这些确切的步骤(没有第一步),控制器应该找出你做了什么,重buildarrays。 基本上,控制器将会看到插槽中的驱动器丢失,并且新的驱动器需要折叠到arrays中。

我想任何人都会同意,在采取这些措施之前,先备份关键数据总是一个好主意 – 我的意思是我确定你已经是:)

最糟糕的情况是,控制器对新驱动器不做任何处理,只是运行降级的arrays,直到您replace丢失的驱动器。 如果这是一个更老的控制器,我会更害怕,但鉴于这是一个后期模型控制器,它应该明确能够做到这一点智能。