在Linux的I / O统计问题

在我们的一台实验室机器中,我突然发现一个磁盘I / O错误。由于我们的应用程序正在处理大量的数据,我们在磁盘上运行了很多I / O。我的机器是硬件RAID5。我从我的一个RHCE专业的朋友那里听说,巨大的I / O也会导致磁盘崩溃。是这样吗?

此外,我还有一个问题,关于恢复我的数据,以防单一磁盘故障在我的RAID5机器。我可以恢复我的文件系统中的数据?

如果是这样,任何人都可以指导我恢复丢失的数据,由于磁盘I / O错误?

在我的RAID5机器出现单磁盘故障的情况下恢复我的数据。 我可以在我的文件系统中恢复数据吗?

这正是RAID5为了生存而失败的原因。 如果RAID5arrays中的一个磁盘发生故障,则不会丢失任何数据,并且系统继续工作,就好像什么也没有发生(arrays被称为“降级”)。

一旦你有一个replace磁盘,只需插入,格式化并重新添加到arrays。 操作系统将负责重新同步新磁盘,并且很快您将再次拥有健康的RAIDarrays。

我从我的朋友那里听说一个RHCE专业人员说,巨大的I / O也会导致磁盘崩溃。 这是真的吗?

是和不是。 很明显,把更多的重点放在硬盘上会增加失败的可能性。 但在很多情况下,这些失败是制造缺陷,而不是压力的结果 – 所以缺陷performance为错误是一个时间问题 。 强调你的硬盘驱动器只是提前触发缺陷。

事实certificate,在高度利用的环境中第一年存活的磁盘从长远来看也更加可靠。 如果您想了解更多关于硬盘故障率的信息,请参阅Google的大型磁盘驱动器人群故障趋势报告(PDF) 。