在CentOS上检查HDD错误和早期失败迹象的最佳方法是什么?
我会build议安装smartmon( http://sourceforge.net/apps/trac/smartmontools/wiki )到您的机器这是一些软件,可以检查您的磁盘的健康,否则将检查/ var / log / messages或/ var / log / syslog中提到任何scsi错误
dmesg
内核将logging有关I / O设备的任何诊断消息,因此您可以使用dmesg命令检查这些消息。
您可以在设备上运行fsck来检查错误。
正如保罗所说,SMART日志是一个检查的好地方。
我也build议运行BadBlocks 。 如果您有RAID卡,则可能必须使用该监视。
SMART监控是一个好方法。 作为根, smartctl -a /dev/hda ,其中hda是你想要的驱动器…可能是hdb,sda等。还build议在/ etc / aliases中设置你的电子邮件地址作为应该得到root用户邮件的人。
虽然这是一个非常模糊的答案。 如果您有任何大型制造商(戴尔,惠普等)制造的服务器,则可能有更好的监控function。
您可以尝试完整检查分区/ dev / sda1(例如)
fsck -f /dev/sda1
或者,尝试对给定分区进行完整的读取 – 非描述性testing
badblocks -vn /dev/sda1