我想知道,如果这个SMART selftest的结果表明一个失败的驱动器,这是在结果中唯一的“完成:读取失败”的驱动器。
# smartctl -l selftest /dev/sde smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed: read failure 90% 8981 976642822 # 2 Extended offline Aborted by host 90% 8981 - # 3 Extended offline Completed: read failure 90% 8981 976642822 # 4 Extended offline Interrupted (host reset) 90% 8977 - # 5 Extended offline Completed without error 00% 410 -
除了SMART自检的输出之外,驱动器还没有显示任何故障迹象。 这是当前正在运行SMART自测的同一系统中不同驱动器的输出
# smartctl -l selftest /dev/sdc smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Self-test routine in progress 30% 15859 - # 2 Extended offline Completed without error 00% 9431 - # 3 Extended offline Completed without error 00% 8368 - SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 1 3 Spin_Up_Time 0x0027 176 175 021 Pre-fail Always - 4183 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 48 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0 9 Power_On_Hours 0x0032 088 088 000 Old_age Always - 8982 10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 46 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 34 193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 13 194 Temperature_Celsius 0x0022 111 101 000 Old_age Always - 36 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 1 198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 1 200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 2
您的数据是否值得冒险驾驶?
如果是我,我会replace驱动器,并感谢SMART为我省下了很大的头痛。
我想补充其他答案中的意见,但我不能因缺乏代表,去图。
您不需要创buildcron脚本,smartmontools包中有一个smartd守护程序,可以处理您想要执行的操作:定期检查SMART状态。 所有你需要的是创build一个configuration并启动服务。 smartmontools软件包还包含一些smartd可以在出现故障时调用的示例脚本。
希望你早已取代了这个驱动器,但是由于没有人直接回答这个问题。
您运行了两个testing,两个testing均未能读取磁盘的相同逻辑扇区,如“ Completed: read failure和两个testing中的相同LBA所示。 这确实表明磁盘有缺陷,您应该可以在保修期内更换磁盘。 尝试在该扇区中存储数据可能会导致驱动器在写入过程中发现其有缺陷并重新映射该扇区,但是如果驱动器没有注意到并且以后不能读取数据,那么您已经丢失了它。
你会怎么做?
首先我找出哪些文件受到影响。 有一些说明如何做到这一点http://smartmontools.sourceforge.net/badblockhowto.html#e2_example1是的。 在你的情况下,这是很难,因为你有一个数组。 但是这是可能的。 确保这个文件是备份的,而不是把零写入失败的扇区。 有两件事情可能发生。 1.驱动器成功将零写入该扇区。 Current_Pending_Sector,Reallocated_Sector_Ct之后应该为零。 2.驱动器无法写入该扇区。 它将这个部门重新映射到一个“备用”区域。
无论如何,你最终会得到一个固定的驱动器。 你应该从备份恢复你的文件(因为你覆盖了它的一个部分)。 此外,您应该重新运行en扩展自我testing,以确保没有更多的错误。
保持健康!
PS我知道这个职位是有点老。 但是我把它扔了 我认为提供另一个好的答案是一个好主意。
驱动器可能正在出路。 无法读取驱动器的部分内容绝对是一种失败的情况,当然也有可能发生这种情况,而没有其他典型的磁盘故障迹象。 这种事情通常不是一时的; 没有其他的迹象,它可能是一个微弱的头,一个非常轻微的alignment问题,或在盘(缸?)有缺陷的地区。
另一个select是有一个聪明的bug; 你真的不想运行一个有bug的固件驱动器。
任何时候,如果您从SMART看到任何错误,这是一个强有力的迹象,您应该得到一个新的驱动器,以避免数据丢失。 它的目的是作为预警系统的一部分。
尽快备份!
如果这个驱动器仍然在保修期内,那么
badblocks工具也可以用于这个(你已经有备份了,对吧?)