SSD读取错误; 我应该担心吗?

一个刚刚超过一个月的SSD在我的系统日志中产生读取错误,只要rsync支持它:

[276877.360221] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0 [276877.360226] ata1.00: irq_stat 0x40000008 [276877.360229] ata1.00: failed command: READ FPDMA QUEUED [276877.360234] ata1.00: cmd 60/10:00:78:a2:27/00:00:07:00:00/40 tag 0 ncq 8192 in [276877.360234] res 41/40:00:78:a2:27/00:00:07:00:00/40 Emask 0x409 (media error) <F> [276877.360238] ata1.00: status: { DRDY ERR } [276877.360240] ata1.00: error: { UNC } [276877.360686] ata1.00: configured for UDMA/100 [276877.360697] sd 0:0:0:0: [sda] Unhandled sense code [276877.360699] sd 0:0:0:0: [sda] [276877.360701] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE [276877.360703] sd 0:0:0:0: [sda] [276877.360705] Sense Key : Medium Error [current] [descriptor] [276877.360708] Descriptor sense data with sense descriptors (in hex): [276877.360709] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 [276877.360717] 07 27 a2 78 [276877.360721] sd 0:0:0:0: [sda] [276877.360724] Add. Sense: Unrecovered read error - auto reallocate failed [276877.360727] sd 0:0:0:0: [sda] CDB: [276877.360728] Read(10): 28 00 07 27 a2 78 00 00 10 00 [276877.360735] end_request: I/O error, dev sda, sector 120038008 [276877.360750] ata1: EH complete [276877.361389] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0 [276877.361392] ata1.00: irq_stat 0x40000008 [276877.361395] ata1.00: failed command: READ FPDMA QUEUED [276877.361400] ata1.00: cmd 60/08:00:78:a2:27/00:00:07:00:00/40 tag 0 ncq 4096 in [276877.361400] res 41/40:00:78:a2:27/00:00:07:00:00/40 Emask 0x409 (media error) <F> [276877.361403] ata1.00: status: { DRDY ERR } [276877.361405] ata1.00: error: { UNC } [276877.361841] ata1.00: configured for UDMA/100 [276877.361847] sd 0:0:0:0: [sda] Unhandled sense code [276877.361850] sd 0:0:0:0: [sda] [276877.361851] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE [276877.361853] sd 0:0:0:0: [sda] [276877.361855] Sense Key : Medium Error [current] [descriptor] [276877.361857] Descriptor sense data with sense descriptors (in hex): [276877.361858] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 [276877.361867] 07 27 a2 78 [276877.361871] sd 0:0:0:0: [sda] [276877.361873] Add. Sense: Unrecovered read error - auto reallocate failed [276877.361875] sd 0:0:0:0: [sda] CDB: [276877.361876] Read(10): 28 00 07 27 a2 78 00 00 08 00 [276877.361883] end_request: I/O error, dev sda, sector 120038008 [276877.361893] ata1: EH complete [276880.336132] ata1.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0 [276880.336140] ata1.00: irq_stat 0x40000008 [276880.336147] ata1.00: failed command: READ FPDMA QUEUED [276880.336157] ata1.00: cmd 60/08:00:78:a2:27/00:00:07:00:00/40 tag 0 ncq 4096 in [276880.336157] res 41/40:00:78:a2:27/00:00:07:00:00/40 Emask 0x409 (media error) <F> [276880.336163] ata1.00: status: { DRDY ERR } [276880.336167] ata1.00: error: { UNC } [276880.336660] ata1.00: configured for UDMA/100 [276880.336670] sd 0:0:0:0: [sda] Unhandled sense code [276880.336672] sd 0:0:0:0: [sda] [276880.336674] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE [276880.336675] sd 0:0:0:0: [sda] [276880.336677] Sense Key : Medium Error [current] [descriptor] [276880.336679] Descriptor sense data with sense descriptors (in hex): [276880.336680] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 [276880.336687] 07 27 a2 78 [276880.336690] sd 0:0:0:0: [sda] [276880.336692] Add. Sense: Unrecovered read error - auto reallocate failed [276880.336694] sd 0:0:0:0: [sda] CDB: [276880.336695] Read(10): 28 00 07 27 a2 78 00 00 08 00 [276880.336701] end_request: I/O error, dev sda, sector 120038008 [276880.336709] ata1: EH complete 

除此之外,磁盘似乎工作正常。 这是一个失败的磁盘,或只是无害的debugging信息的迹象?

吉姆,死了。

更换有问题的硬件。

当然,由于您使用的是低端桌面主板(DEAR GOD WHY?),您可能需要花点时间testing驱动器控制器或电缆是否出现故障。

一方面,我可能会先尝试挖掘驱动器的文档。 另一方面,我可能会考虑一个错误消息,说:“无法恢复的读取错误 – 自动重新分配失败”作为指示驱动器应被视为有罪,直到certificate无辜。 我会马上把数据关掉。

现在,只有一个月大,它应该仍然在保修期内。 最快捷的方法可能就是试图用这些未被发现的读取错误作为替代或退款。

制造商可能会更换驱动器,无论错误是否重大 – 让客户满意。 但如果这是一个常见的错误,而且不重要,他们可能会告诉你。 否则,他们冒险将库存循环到市场上的每一位买家。 (无论如何,每个买家都是系统pipe理员。)

问题可能与在服务器中使用消费级驱动器有关。 (根据Adata的网站,你的驱动器不是服务器级的驱动器。)我想说你不久的将来至less有三个小项目。

  1. 从驱动器获取数据。
  2. 获得退款或更换,最好是退款。
  3. 制定一项政策,以便更好地做出购买服务器硬件的决定。

驱动器丢失了您的数据,您可以更换它,但是如果您只想继续使用驱动器(有可能再次丢失数据),则可以尝试在该位置写入零。 这是一个RAID设置会为你做的,它会发现它不能读取,零位,并从RAID结构中恢复数据,然后重新写回到坏的地方。

如果您自行使用该设备,上述build议或者不带保修的build议都是非常明智的。 如果它丢失了一次数据,它很可能会再次。