HDD-Errors,同时构buildSoftware-RAID5

我想用CentOS 6或Scientific Linux 6构build新的NAS,但是我无法构buildRAID5。 我使用mdadm创build了一个新的RAID设备,但经过几个小时的工作,mdadm将一个或两个硬盘标记为故障并使arrays降级。 每次它标记不同的硬盘失败。 我在Fedora 13,CentOS 5.5和Scientific Linux 6.0上试过了。
所有组件都是新的,SMART值显示没有错误。

... after many errors ... ata6.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen ata6.00: failed command: READ DMA EXT ata6.00: cmd 25/00:00:ff:2d:5c/00:01:90:00:00/e0 tag 0 dma 131072 in res 40/00:14:e7:45:46/00:00:90:00:00/40 Emask 0x4 (timeout) ata6.00: status: { DRDY } ata6: hard resetting link ata6: SATA link up 1.5 Gbps (SStatus 113 SControl 310) ata6.00: configured for UDMA/133 sd 6:0:0:0: [sdd] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 6:0:0:0: [sdd] Sense Key : Aborted Command [current] [descriptor] Descriptor sense data with sense descriptors (in hex): 72 0b 00 00 00 00 00 0c 00 0a 80 00 00 00 00 00 00 00 00 e6 sd 6:0:0:0: [sdd] Add. Sense: No additional sense information sd 6:0:0:0: [sdd] CDB: Read(10): 28 00 90 5c 2d ff 00 01 00 00 end_request: I/O error, dev sdd, sector 2421960191 raid5:md0: read error not correctable (sector 2421960128 on sdd1). raid5: Disk failure on sdd1, disabling device. raid5: Operation continuing on 4 devices. raid5:md0: read error not correctable (sector 2421960136 on sdd1). ... 

什么可能导致这些问题?


我的系统:
主板:Intel DH57JG
CPU:Intel Core i3-540
内存:海盗船XMS3 2GB DDR3
PSU:Seasonic S12II-330Bronze
SATA控制器:4个板载,2个带JMB363芯片组的PCIe控制器
硬盘:6倍西数WD20EARS

最后一次尝试的日志:
缩短的日志 , 完整的日志

WD20EARS是鱼子酱绿色模型,对吧?

我不知道他们是否正在“变绿”,并在一段时间不活动之后转动下来,导致mdadm认为他们已经死亡。 这可能也会导致不同的驱动器退出。

我知道一些WD硬盘在RAIDarrays中有问题,因为固件会做一些错误检查,并且没有足够快的响应,所以主机认为它是失败的。 我只是在硬件RAIDarrays中听说过这个,但是也可能适用于这种情况。

在一天结束的时候,做任何forms的RAID的消费者磁盘永远不会是完美的,你的里程可能会有所不同。

(我是和上面一样的Dani31,但是我失去了我的用户[在live-cd上写了这个条目])

由于本·皮尔布洛(Ben Pilbrow)的回答,我读了很多有关WD20EARS的内容,并改变了一些东西:

  • 我用wdidle3设置加载周期时间为300s
  • 并使用fdisk -c -u /dev/sdX正确格式化磁盘(使用4K扇区)

这些变化之后,build设过程快了一倍,但又失败了。 这一次是同样的驱动器,导致中止(我认为这是不同的驱动器名称,因为我使用不同的分配)。

我查看了内核日志,看到了很多读取错误,所以我在这个驱动器上启动了badblocks ,并在内核日志中出现了相同的错误。

我从Western Digital下载了Data Lifeguard Diagnostics Tool,并开始对驱动器进行扩展testing。 结果是“发现了太多的错误 – 更换驱动器”。

我想我的新驱动器问题会解决。
感谢您的帮助!