Linux软件RAID1有问题

我有一个软件RAID1,现在每周Linux同步我的RAID卷。

我检查了cat /proc/mdstat

  *Personalities : [raid1] md3 : active raid1 sda5[0] sdb5[1] 1822445428 blocks super 1.0 [2/2] [UU] md1 : active raid1 sdb2[1] sda2[0] 524276 blocks super 1.0 [2/2] [UU] md2 : active raid1 sda3[0] sdb3[1] 1073741688 blocks super 1.0 [2/2] [UU] [============>........] check = 61.9% (665688192/1073741688) finish=203.8min speed=33367K/sec md0 : active raid1 sda1[0] sdb1[1] 33553336 blocks super 1.0 [2/2] [UU] unused devices: <none>* 

这似乎是正常的。 但我validation/日志/消息,发现:

 41/40:80:20:48:c3/00:00:04:00:00/00 Emask 0x409 (media error) <F> May 26 10:45:45 CentOS-62-64-minimal kernel: ata2.00: status: { DRDY ERR } May 26 10:45:45 CentOS-62-64-minimal kernel: ata2.00: error: { UNC } May 26 10:45:45 CentOS-62-64-minimal kernel: ata2.00: configured for UDMA/133 May 26 10:45:45 CentOS-62-64-minimal kernel: ata2: EH complete May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0 May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: irq_stat 0x40000008 May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: failed command: READ FPDMA QUEUED May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: cmd 60/80:00:00:48:c3/00:00:04:00:00/40 tag 0 ncq 65536 in May 26 10:45:48 CentOS-62-64-minimal kernel: res 41/40:80:20:48:c3/00:00:04:00:00/00 Emask 0x409 (media error) <F> May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: status: { DRDY ERR } May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: error: { UNC } May 26 10:45:48 CentOS-62-64-minimal kernel: ata2.00: configured for UDMA/133 May 26 10:45:48 CentOS-62-64-minimal kernel: sd 1:0:0:0: [sdb] Unhandled sense code May 26 10:45:48 CentOS-62-64-minimal kernel: sd 1:0:0:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE May 26 10:45:48 CentOS-62-64-minimal kernel: sd 1:0:0:0: [sdb] Sense Key : Medium Error [current] [descriptor] 

任何帮助? 它可以是什么,我需要做什么?

通常这些错误意味着驱动器(你的情况下的/ dev / sdb)可能会很快失败。

您可以使用smartctl进行扩展的SMART自检,以查看是否有任何错误出现。

您可以通过运行来进行扩展检查

 smartctl -t long /dev/sdb 

您可以通过运行查看结果(以及更多信息)

 smartctl -a /dev/sdb 

还要查找Relocated_Sector_CtOffline_Uncorrectable值。 它们应该是0.如果Relocated_Sector_Ct > 0,则意味着驱动器已经将一些难以读取的扇区重定位到驱动器的备用区(这是正常行为 – 但表示驱动器很快可能会失败)。 如果Offline_Uncorrectable > 0,则表示驱动器发生故障。

请张贴smartctl -a /dev/sdb

如果未安装smartctl,则可以通过运行来安装

 yum install smartmontools -y 

此外,您得到的这些错误可能是由于驱动器的电源故障或有故障的SATA电缆。

看来你的sdb驱动器失败了。 在太晚之前更换它。 您可以尝试使用SMART工具来确认诊断,并使用如下命令:

 sudo smartctl -q errorsonly -H -l selftest /dev/hda