内存和CPU使用情况良好时,服务器可能挂起的原因是什么?

一些线索:

平安工作正常,但网站访问和实用工具,如SSH慢慢慢!

内存和CPU使用率都很低,可以忍受。

我用traceroute,平均结果不超过100ms。

这是在多个云服务器上同时启动的。

相关问题: 远程服务器挂起,卡住了。 如何debugging?

我想知道如果托pipe公司无法到达,我可以在哪里看下。 任何帮助当然赞赏。

尝试将一个数据包嗅探器(如wireshark)连接到系统,以查看networking正在等待的时间。 如果您看到丢包或大量的重新请求,它可能会让您知道发生了什么事情。

另外,我不确定你给出的例子的意思,“这个问题可能跟踪跟踪”。 Traceroute是一个应用程序,您可以使用它来确定从您到供应商的第3层链接之间的延迟时间。 也许这意味着你在服务器和它连接的任何地方都有很高的延迟?

关于我的头顶,我可以想到两件适合当前可用信息的事情。

如果使用ssh连接到你的机器是慢的,但是当你得到shell是可用的,我会查看是否有dns和/或syslogd。 我曾经遇到过syslogd陷入困境,logging你的连接需要几分钟的时间。 另一种情况是反向查找超时,而不是返回NXDOMAIN,为我的.in-addr.arpa区域configuration了错误的dns-servers,这对于syslogd,httpd和sshd都是一样的。

你可以尝试禁用反向查找syslogd,sshd和httpd,看看是否能解决你的缓慢? (如果是这样,我会考虑DNSparsing器configuration,并试图找出为什么它会超时)。

另一件我能想到的事情是,如果你的IO子系统超载,你可以用iostat,sar或dstat等工具来看这个。 (并且可能还增加了cpu负载平均值)。