我有一台运行Centos(5)的旧版本的服务器。 一天一次,4-5分钟,有时更长,服务器不可访问。 几分钟后,它再次可用。 这很奇怪。
我检查消息并确保安全,并且在无法访问的时候没有看到任何事情发生。 例如,今天我在上午7:50左右ssh'd。 当我环顾服务器,我的terminal挂了。 所以我closures了terminal,试图重新连接,不能。 我试图访问(使用浏览器)在该服务器上运行的网站,不能。 然后,大约8点03分,一切似乎恢复正常。
我的问题是我应该检查哪些日志,系统或文件,以确定这种情况的原因。 顺便说一下,它经常发生在每天的同一时间。 但不完全。
感谢您的任何提示或指针。
我刚刚在CentOS 5机器上安装了sar(系统活动报告) ,所以我可以知道当Web服务器停止响应请求时发生了什么。 我还没有完全探索它(除了validationcron作业是每隔10分钟logging系统信息),但是这里有一些基本的信息和指针。
根据维基百科的文章
sar(系统活动报告)是Solaris派生的系统监视器命令,用于报告各种系统负载,包括CPU活动,内存/页面调度,设备负载,networking。
在Linux发行版中,它由sysstat包提供。
用 IBM的SAR进行简单的系统监控对使用sar有很好的介绍。
这篇Softpanorama文章也是由Sean Walberg(同上)撰写的。
也可以看看: