我一直在一个专门的CentOS服务器硬盘驱动器的问题与以下症状:
我已经完成的testing:
在这一点上我的问题是:
我只是想确保问题是硬盘驱动器,然后我提交一个服务请求来改变它(如果它不是硬盘驱动器可能最终花费我)。
更新:我更改了硬盘,但在复制大文件时出现了相同的损坏错误,所以它不是驱动器,除非我有幸得到两个驱动器完全相同的问题。 使用“cmp”命令,我发现它始终是在损坏的文件中从0翻转为1的字节的MSB。 我正在整个服务器硬件交换,所以我不知道问题的确切原因。
硬盘错误往往会被内核抓住。 你的服务器是否有ECC内存(它应该)…没有它的内存错误可以错过。 与RAID适配器上的任何高速cachingRAM相同。 拉动DIMM,清洁触点并重试,或者尝试运行Memtest。
检查驱动器上的SMART错误可能会有帮助。 如果没有SMART错误,驱动器可能会失败,但是通常情况下,边缘驱动器将会拥有它 “smartctl -a / dev / sd [x]”或者smartctl –test = long / dev / sd [x]应该提供更多的信息。
你在内核日志中看到高清写入错误吗? 确保检查驱动器的SMART状态,例如: http : //www.captain.at/howto-linux-smartmontools-smartctl.php
此外,损坏的内存可能会导致损坏的文件。 你有远程KVM访问机器吗? 在这种情况下,您应该运行memtest或类似的( http://www.memtest.org/ )