我的硬盘驱动器故障?

我只是试图在我的硬盘上运行一个testing,它不想完成一个自我testing。 结果如下:

smartctl --attributes --log=selftest /dev/sda smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build) === START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 697 3 Spin_Up_Time 0x0027 206 160 021 Pre-fail Always - 691 4 Start_Stop_Count 0x0032 074 074 000 Old_age Always - 26734 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 28 9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 7432 10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 097 097 000 Old_age Always - 3186 191 G-Sense_Error_Rate 0x0032 001 001 000 Old_age Always - 20473 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 84 193 Load_Cycle_Count 0x0032 051 051 000 Old_age Always - 447630 194 Temperature_Celsius 0x0022 113 099 000 Old_age Always - 34 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 16 198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0 SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed: read failure 90% 7432 92290592 # 2 Conveyance offline Completed: read failure 90% 7432 92290596 # 3 Conveyance offline Completed: read failure 90% 7432 92290592 # 4 Short offline Completed: read failure 90% 7431 92290596 # 5 Extended offline Completed: read failure 90% 7431 92290592 

那么这个磁盘失败了吗?

你的驱动器很乐意做一个自检; 从总结来看,过去一小时内已经完成了五个以上的工作。 在testing的早期,他们都失败了,并且有错误。

是的,这个硬盘是失败的。 正如着名的Google实验室报告所言(尽pipe目前我不能把手放在链接上),如果smartctl说你的驱动器出现故障,那很可能是(我的解释)。

编辑 :不要试图保存它。 获取所有的数据,并将其replace。

要回答您的问题,SMARTtesting失败是即将发生驱动器故障的绝好迹象。 您应该备份您的数据并尽快更换驱动器,以防止潜在的数据丢失。

@ sj0h提到了负载循环次数,这个数字非常高,为447,630。 (大多数现代硬盘驱动器的devise可以承受60万次加载/卸载周期。)这通常是由高级电源pipe理(APM)function引起的,该function通过在几秒钟内停放磁头(将磁盘从磁盘上卸下)来节省电源闲。 头部在需要时被重新装回到盘片上。 在大多数系统中,如果硬盘驱动器发生间歇性的断断续续的活动,会导致大量的加载/卸载循环。 要closuresAPM,请在根提示下运行以下命令:

 smartctl -s apm,off /dev/sda 

每当系统重新上电或进入hibernate状态或驱动器断电时,都需要运行该命令,因为驱动器closures时该设置不会被保留。

根据我的经验,这样做会大大减less加载/卸载周期的数量,从而有可能在未来再次遇到这种故障。 但请注意,这样做会增加功耗和驱动温度。 如果变频器在温度超过50°C的情况下持续运行,则过早失效的风险会增加,因此在温暖的月份,您可能需要离开APM(如果它closures,请将其打开)。

除了读取失败之外,还要考虑负载循环计数。 在接近50万时,这可能表明失败的原因,或者至less是高负载循环磨损。 加电时间的每一分钟都有一个加载周期。 更换驱动器后,确保新的驱动器没有这样做。

是的,你有16个扇区是不可读的,你已经尝试了几个在驱动器的大致相同的区域都失败了的testing,所以备份速度很快,但是请记住,你有数据已经​​无法访问了,部门92290592,92290596。

你可能还有其他有问题的地方,你还不知道这16个扇区是连续还是分散的,如果你想在备份后玩,你可以用-t select,startlba-endlba做select性自检。

Current_Pending_Sector表示硬盘固件尝试读取,但不能,它会尝试几次(无论何时操作系统要求),直到失败并将其标记为Offline_Uncorrectable或将replace损坏的扇区的另一个备用扇区,如果OS写入(因此增加了Reallocated_Sector_Ct)。

我会亲自更换驱动器。 如果你出于某种原因不想这么做,但是暂时还不能这样做,你需要一些方法来确保你不会不好意思地使用不好的区域来处理新的文件。

我在一台旧录像机上录下了这样一个驱动器,然后决定我不想改变它,因为这些video真的很棒。 所以我需要隔离错误。 首先,我为坏文件创build了一个空文件夹,然后尝试读取磁盘上的所有现有文件,其中任何一个出错的文件都被移到了坏文件目录(希望只是不重要)。

然后,我创build了很多唯一命名的一兆字节文件来填满硬盘(因此所有的空白空间现在都在这些1 MB文件之一中),然后重复该过程。 所有错误的文件被移动到坏文件目录,剩下的文件都很好,可以删除以回收坏的空间。

您现在可以使用更长的驱动器,但不要用于重要的东西。 它失败更多,并且当它发生的时候很可能是不方便的。

这不是一个很好的迹象。 您应该确保磁盘的内容已经备份,而不是将磁盘用于任何重要的事情。

但是,我已经看到有失败扇区的磁盘重新分配它们,并保持运行多年,所以你可以保留一段时间,例如,对于不重要的东西或其他备份。

那么要做的一件事就是查看哪些文件被不可读扇区破坏,并写入这些扇区以强制磁盘重新分配(将它们从“Current_Pending_Sector”移动到“Reallocated_Sector_Ct”)。 如果使用Linux,请参阅http://smartmontools.sourceforge.net/badblockhowto.html 。 一旦这些部门重新分配后,自检应该通过或报告更多不可读的部门。

我不同意大多数答案,我不认为坏道一定是即将失败的迹象。 正如http://blog.mmueh.net/index.php/2010/12/09/luks-meets-badblocks/所说,“每一次硬盘在其生命的某个时刻都开始产生坏道”。