RAID5arrays问题 – 首先复制数据或更换驱动器

我inheritance了如下紧急情况。

  • 2个16磁盘RAID5存储系统(一个存储主数据,一个存储备份)
  • 备份系统没有监视,两个磁盘失败,所有的数据都丢失 – 这不是一个大问题
  • 主系统显示有2个磁盘有媒体错误,一个稳定在30左右,另一个在2000左右,但是缓慢增长(一周左右后是2,100)

有更长期的计划,使用更好的存储,使用热备件,更好地监控,build立镜像,备份等等,但是当务之急是保护主数据,因为这对业务至关重要,但是坐在一个RAID5arrays上,两个磁盘显示错误

我们已经基本上把选项搞清楚了

选项1

  • 用2000个媒体错误换出磁盘,然后重buildRAID5arrays
  • 一旦完成,换出其他磁盘与媒体错误

主要关心的是,arrays正在重build(24-48小时?),系统中没有冗余,任何磁盘故障都意味着所有数据的丢失。

选项2

  • 保持RAID5arrays不变,并将数据复制到新的存储arrays上

主要关心的是,它将需要比RAID重build长很多倍,因为文件系统有许多百万个小文件,所以副本可能需要接近一个月才能完成,而不会影响正在使用这些文件的站点

我会感兴趣的意见,你会采取哪种方法,为什么? 这个级别的媒体错误是否令人担忧? 媒体错误的增长水平是否令人担忧?

是的,我会担心的,考虑到你的情况,我会得到另一个系统,尽快做一个备份,因为任何尝试重build都可能很容易导致失去一切。

RAID 5的有趣之处在于,您可能在另一个驱动器上显示URE,因此即使是您认为正在工作的磁盘也不是。 因此你的“重build错误”。

获取一个系统来复制您的数据,并尽快备份这些文件。 然后担心重build服务器。

…虽然亲自一旦你得到了备份,并知道这是好的,我会改变你的服务器完全然后到RAID 10或6的东西,开始新鲜…