我可以检查什么,以了解为什么服务器无法访问

我有一台运行Centos(5)的旧版本的服务器。 一天一次,4-5分钟,有时更长,服务器不可访问。 几分钟后,它再次可用。 这很奇怪。

我检查消息并确保安全,并且在无法访问的时候没有看到任何事情发生。 例如,今天我在上午7:50左右ssh'd。 当我环顾服务器,我的terminal挂了。 所以我closures了terminal,试图重新连接,不能。 我试图访问(使用浏览器)在该服务器上运行的网站,不能。 然后,大约8点03分,一切似乎恢复正常。

我的问题是我应该检查哪些日志,系统或文件,以确定这种情况的原因。 顺便说一下,它经常发生在每天的同一时间。 但不完全。

感谢您的任何提示或指针。

我刚刚在CentOS 5机器上安装了sar(系统活动报告) ,所以我可以知道当Web服务器停止响应请求时发生了什么。 我还没有完全探索它(除了validationcron作业是每隔10分钟logging系统信息),但是这里有一些基本的信息和指针。

根据维基百科的文章

sar(系统活动报告)是Solaris派生的系统监视器命令,用于报告各种系统负载,包括CPU活动,内存/页面调度,设备负载,networking。

在Linux发行版中,它由sysstat包提供。

用 IBM的SAR进行简单的系统监控对使用sar有很好的介绍。

这篇Softpanorama文章也是由Sean Walberg(同上)撰写的。

也可以看看:

  • 使用sar进行长期性能分析
  • 格式很好的手册页