远程Fedora系统无响应,奇怪但一致的行为,当试图login

我有一堆运行在一年前的Fedora安装的网站。 今晚,所有的网站都停止了回应。 我一直在尝试login进行调查,但不能,而且我对做什么也不知情。

Ping服务器工作,响应时间很不错,〜200ms。

当我嘘,“上次login:…”文本出现,但没有更多。 但是,如果我离开它,并打开另一个SSH会话,第一个实际login(我已经设置使用密钥,而不是密码),新的卡住在“上次login:。 ..“。 我可以重复这一次,因为我已经尝试了 – 打开一个新的SSH会话总是使以前打开的login。

login后,我可以在没有连接(?)冻结的情况下始终运行唯一的命令,在我的主目录中是ls 。 我已经能够sudo su一次,但是每隔一段时间事情都会冻结,就像运行其他命令一样( topkillall -9 httpdps aux是我试过的)。

这种模式对任何人都熟悉吗? 任何提示如何进行将不胜感激!

这听起来像你的系统负载很重。 这很可能会交换很多,否则使用磁盘I / O。

我怀疑发生的是由于某些原因*)您的网站突然收到大量的HTTP请求到一些沉重的dynamic页面,这使得Apache消耗所有的服务器资源。 真正的原因也可能是一个负载沉重,响应速度慢的数据库服务器,这会增加Web服务器的页面加载时间,这将使Apache消耗更多的进程,这将导致服务器过载,这将导致情况你正在观察。

你的网站通常有很多的stream量? 一个球场的数字将是很好的 – 我们是在谈论成千上万的点击,每天数以万计的点击,数百万…?

你有你的服务器的资源图吗? 像snmpd + mrtg或Cacti绘图CPU,内存,磁盘使用情况? 如果有,有什么尖峰? 或者如果你安装了sysstat软件包,那么你可能有sar快照可用 – 尝试命令sar 。 它会每10分钟左右保存一次有关您的系统的各种信息,并通过它报告您可能会看到正在发生的事情。

而这个Fedora安装是一个单独的物理服务器还是以某种方式取决于你所谈论的VMware环境? 难道你的VMware基础架构的某些部分会不时被超负荷工作,这是你的问题的真正原因吗?

此外,在尘埃落定后,我会调查日志,看看有没有内核大喊OOM(Out of Memory)杀手,或者如果httpd日志看起来可疑的迹象。

通常,如果我无法亲眼看到httpd日志中的任何可疑内容,我将让Webalizer或类似的分析器运行该日志,看看是否有URL出现在输出中。 或者我只是将日志传送给apachetop ,看看发生了什么。

*)原因可能是DoS攻击,错误的PHP脚本,错误的.htaccess文件使您的ErrorDocument页面recursion调用自身,Slashdot / reddit效果或其他完全不同的东西。

哦,昨天早上,我的虚拟服务器(CentOS 5.4通过VMWare运行)遇到了同样的问题。 当我尝试以详细模式ssh时,它挂在:

 debug1: Entering interactive session. 

如果我打开另一个SSH会话,第一个继续一些debugging信息,并陷入:

 debug2: callback start debug2: client_session2_setup: id 0 debug2: channel 0: request pty-req confirm 1 debug2: channel 0: request shell confirm 1 debug2: fd 3 setting TCP_NODELAY debug2: callback done debug2: channel 0: open confirm rwindow 0 rmax 32768 debug2: channel_input_status_confirm: type 99 id 0 debug2: PTY allocation request accepted on channel 0 debug2: channel 0: rcvd adjust 2097152 debug2: channel_input_status_confirm: type 99 id 0 debug2: shell request accepted on channel 0 Last login: 

几分钟后,它实际上给了我一个命令提示符。

但在下午,我可以正常地ssh。 对我来说很奇怪,我无法在Google上find任何信息。

PS:我也使用公钥而不是密码。