在启动过程中,我收到一条消息,说md RAIDarrays已经退化。 我的第一反应是重新启动。 一切似乎现在工作得很好。 所有磁盘都是活动的。
令我担忧的是,其中一个磁盘正沿着薄薄的生命线前进。 我如何诊断哪个磁盘暂时失败? 我可以运行一些testing,看看是否需要更换? 它仍然在保修期内,所以如果我replace它,我希望能够声称它真的接近死亡。
很明显,你得到的mdadm警告应该告诉你哪个光盘被降级了。 你可以把你的问题和当前的/proc/mdstat输出一起剪切粘贴吗?
其次,写入错误到一个MD设备应logging在syslog下。 你可以用grep sda /var/log/messagesfind任何东西吗? 您可能需要在grep中运行sd[af]和hd[ad] ,以确保捕获所有可能的光盘。
第三, smartctl -a /dev/sda应该在/ dev / sda上提供健康检查信息,对于其他硬盘也是如此,如果它们是SMART感知的,就像大多数现代硬盘一样。
如果你不能从中得到什么,这可能不是很失败!
稍后编辑: Marcog,对不起,我的坏,我错过了关于你的警告“引导过程中”一点。 我真的应该仔细阅读。 我同意你的看法,这听起来像一个光盘没有被正确检测到。 虽然我build议smartctl路线; 它可以与-t一起使用来强制执行一套testing(请参见手册页),其中许多testing适用于实时光盘(包含数据并已安装)。 我每隔几个月就会这样做,只是为了避免没有预料到的失败