我有一个RHEL 6.4服务器,运行一个Java应用程序,加载60多个war文件到tomcat中,内存为64GB。 出于某种原因,每次加载时,每个用户都会被踢出。 这包括物理服务器上直接连接的显示器。
服务器不会生成任何types的崩溃日志,但无法login。仍然显示基于磁盘光盘的磁盘活动。
我试图确定这个应用程序是否是原因,还是仅仅是一些底层硬件/软件问题的症状。 有趣的是,我可以说只有这个应用程序才会发生。 即使运行memtest86显示没有内存错误和压力testing获得负载到160 100%的内存使用率没有崩溃。
我的两个问题是这些:
编辑:没有找出为什么连接被切断。 但是,我将物理驱动器移动到另一台服务器(相同的硬件),并且问题不会发生在新盒子上。 让我相信有硬件问题的地方。
尝试将strace附加到其中一个loginshell,然后将跟踪发送到一个文件,并将其扔到后台。 那就是没有被抓住的希望。
就像是:
PID='' FILE_OUT='' strace -D -t -f -v -p ${PID} -o ${FILE_OUT}
这样你就可以看到它的信号/命令,导致它关机
现在我想到了,我会在login之一,而且是Java应用程序。 你可以调整时间戳,看看两个线程之前/之后发生了什么。