我最近安装了一些新的服务器。 这次我使用dmcrypt + LUKSencryption大部分分区。 然而这些新的服务器每隔几天就会经常崩溃。 完全locking,内核不响应键盘,系统不能ping通。 根据Munin图和atoplogging,资源使用量没有增加。 本地系统日志中没有相关的日志logging。 在我们的远程日志主机上没有相关logging(新的服务器将syslog转发到)。 没有相关的netconsole消息(新服务器使用netconsole将所有内核消息转发到日志主机)。 内核甚至没有给TTY打印任何东西。 我问托pipe公司进行全面的硬件testing,他们什么都没发现。 我怀疑LUKS。 其他人是否也经历过LUKS的全面locking? 我能find的唯一参考是http://ubuntuforums.org/showthread.php?t=2125287 。
尝试在dmcrypt + LUKS分区上设置Arch和Debian系统时遇到了类似的问题。 在使用dd if=/dev/zero of=/dev/mapper/crypt1命令安全删除LUKS分区之后,在覆盖6-7GB的数据之后,问题总是浮出水面。 原来是内存模块故障,4x4GB中的一个。
隐藏设置常见问题解答页面上的第4.3项描述错误的内存如何在写入encryption设备的同时造成严重的损坏,以及相关的症状,如冻结和locking,这使我怀疑内存有问题。
如果我是你,我会怀疑托pipe公司如何检查他们的系统。 告诉他们将Memtest86 +和Memtester的至less一个循环的结果转发给你。
笔记
仅供参考,我列出了一些描述我在search提示和解决scheme时遇到的类似问题的post/讨论: