如何维护一个EXT3文件系统

最近我有几台服务器在EXT3文件系统上遇到了写入错误,并因此重新安装了文件系统只读。 在生产服务器上可以理解,这会导致严重的问题。 在重新启动固定的大型分区的文件系统时,这需要花费很多时间。 在修复了文件系统之后,纠正了几个错误,服务器再次运行良好。

我能做些什么来最小化发生这种情况的速度? 我似乎无法find关于定期检查正在运行的服务器上的文件系统的信息。 是否可以改变EXT3 /系统处理写入错误的方式? 什么将是一个理智的解决scheme。

所有与此有关的服务器都运行CentOS Linux 5.4或5.5。

ext3不应该有任何写入错误,如果有的话,你应该检查可能的硬件缺陷(很可能是损坏的磁盘或布线问题)。

你可以使用-o errors=continue选项挂载你的文件系统。 检查man mount详细信息。 但是,这不是build议,我同意SvenW。 如果您有硬件RAID卡,请对其进行一些检查,强制它validationarrays上的完整性。 电缆如何? 你确定他们是完整的吗? 至于定期检查正在运行的服务器上的文件系统 – 它们必须被卸载。 如果可能的话,你可以select隔夜的时间。