RAIDarrays降级了，但在重新启动时“很好”

在启动过程中，我收到一条消息，说md RAIDarrays已经退化。我的第一反应是重新启动。一切似乎现在工作得很好。所有磁盘都是活动的。

令我担忧的是，其中一个磁盘正沿着薄薄的生命线前进。我如何诊断哪个磁盘暂时失败？我可以运行一些testing，看看是否需要更换？它仍然在保修期内，所以如果我replace它，我希望能够声称它真的接近死亡。

很明显，你得到的mdadm警告应该告诉你哪个光盘被降级了。你可以把你的问题和当前的/proc/mdstat输出一起剪切粘贴吗？

其次，写入错误到一个MD设备应logging在syslog下。你可以用grep sda /var/log/messagesfind任何东西吗？您可能需要在grep中运行sd[af]和hd[ad] ，以确保捕获所有可能的光盘。

第三， smartctl -a /dev/sda应该在/ dev / sda上提供健康检查信息，对于其他硬盘也是如此，如果它们是SMART感知的，就像大多数现代硬盘一样。

如果你不能从中得到什么，这可能不是很失败！

稍后编辑： Marcog，对不起，我的坏，我错过了关于你的警告“引导过程中”一点。我真的应该仔细阅读。我同意你的看法，这听起来像一个光盘没有被正确检测到。虽然我build议smartctl路线; 它可以与-t一起使用来强制执行一套testing（请参见手册页），其中许多testing适用于实时光盘（包含数据并已安装）。我每隔几个月就会这样做，只是为了避免没有预料到的失败