什么可能导致RAID 10的所有硬盘同时崩溃?

我周末有个灾难, 我用一些虚拟化(KVM)运行服务器; 他们每个都有100个左右的用户。 全天负载为0.40-0.89,机器有128GB RAM。

那么:在星期六服务器不再可用。 我立即使用我的IPMI-Access,并不能相信我所看到的:RAID完全降级。 只有2个硬盘“活着”,但没有数据。

大约一个小时之前,我被告知有关崩溃,我看到有一个Proxmox备份运行。 但是,这可能是所有HDD崩溃的原因吗?

我不太清楚我应该怎么做,以防止这个…

但是,这可能是所有硬盘崩溃的原因吗?

这似乎不太可能,但也许是与Proxmox检查可能是一个想法?

我不太确定我应该怎么做才能防止这个…

为了防止这种情况再次发生,您需要了解为什么会发生这种情况。

要做到这一点,你需要把你的(或其他人的)系统pipe理员工具包来解决这个问题,并做一些根本原因分析。

我发现好的旧的科学方法是完美的工具。

以下是我之前准备的一些问答 ,应该帮忙。

我想可以想象,在你的情况下,阅读你的日志的相关信息将是一个很好的开始。