服务器维护以防止fsck失败

有一次在重新启动后,我发现fsck在操作系统磁盘上会失败,在我的很多服务器上启动变得不可能。 然后我不得不重新安装操作系统,并从失败的操作系统磁盘进行数据迁移。
下列措施是否可以防止这种情况发生?

 1.定期在磁盘上调度fsck
 2.使用RAID 5/6

任何其他build议和最佳实践?

有一次在重新启动后,我发现fsck在操作系统磁盘上会失败,在我的很多服务器上启动变得不可能。

你正在这些系统上进行优雅的重启/关机吗? 如果你这样做(意味着文件系统得到干净的卸载),你仍然看到腐败,那么底层存储很可能存在问题。

你使用什么文件系统? 希望你使用的是一个日志文件系统? 使用日志logging的文件系统,即使它们很难下载(意味着服务器在干净的卸载之前closures),大规模的损坏是非常不可能的。

1.定期在磁盘上调度fsck

这样做不会伤害,但如果你的硬件是好的,也不是那么必要的。

  1. 使用RAID 5/6

RAID不会为你做一件事情。 RAID保护硬件故障,而不是文件系统故障。

  • 在RAM上运行一个memcheck。 如果你的内存不好,会造成文件系统的随机损坏。
  • 在您的硬盘和主板上运行健康检查