任何人遇到与LUKS完整的系统locking?

我最近安装了一些新的服务器。 这次我使用dmcrypt + LUKSencryption大部分分区。 然而这些新的服务器每隔几天就会经常崩溃。 完全locking,内核不响应键盘,系统不能ping通。 根据Munin图和atoplogging,资源使用量没有增加。 本地系统日志中没有相关的日志logging。 在我们的远程日志主机上没有相关logging(新的服务器将syslog转发到)。 没有相关的netconsole消息(新服务器使用netconsole将所有内核消息转发到日志主机)。 内核甚至没有给TTY打印任何东西。 我问托pipe公司进行全面的硬件testing,他们什么都没发现。 我怀疑LUKS。 其他人是否也经历过LUKS的全面locking? 我能find的唯一参考是http://ubuntuforums.org/showthread.php?t=2125287 。

尝试在dmcrypt + LUKS分区上设置Arch和Debian系统时遇到了类似的问题。 在使用dd if=/dev/zero of=/dev/mapper/crypt1命令安全删除LUKS分区之后,在覆盖6-7GB的数据之后,问题总是浮出水面。 原来是内存模块故障,4x4GB中的一个。

隐藏设置常见问题解答页面上的第4.3项描述错误的内存如何在写入encryption设备的同时造成严重的损坏,以及相关的症状,如冻结和locking,这使我怀疑内存有问题。

如果我是你,我会怀疑托pipe公司如何检查他们的系统。 告诉他们将Memtest86 +和Memtester的至less一个循环的结果转发给你。

笔记

仅供参考,我列出了一些描述我在search提示和解决scheme时遇到的类似问题的post/讨论:

  • 这家伙有一些看门狗进程报告的CPUlocking。 虽然看起来他的问题与encryption或错误的内存无关,而是一个错误的CPU风扇,这是当我开始怀疑硬件问题。
  • 这些人似乎有类似的情绪,线程中的最后一句话提到“大量的RAM”。
  • 这个线程 (也在这里 )描述了内核版本2.6.24的软locking问题,很久以前,当时提交了一个补丁。 这些情况看起来很相似,但是对我来说,根本原因是不同的。 这篇文章似乎也描述了同样的问题。