proftpd,sshd和apache进程在Linux发行版上使用/etc/init.d/its-script运行。
我用监控服务监视21,22和80个端口:每5分钟服务检查一次端口,只通知故障。 24小时的失败次数是5-6次。 似乎有人踢开关有时候..
我添加监控和收集监控,每隔1分钟监控21个,22个和80个端口。 我没有收到农场监测服务通知。 我只收到monit通知失败和/或成功/更改proftpd,sshd或apache进程的PID号。 24小时的失败仍然是5-6次。 收集关于cpu的监控,平均负载,每个过程都是规则的,没有高峰。 有没有什么踢开关,但有一些决定故障监测。 这是一个简单的干扰,还是表示一些exception?
什么可能导致这些失败?
这里要做的是开始挖掘系统日志,看看这些重新启动的原因是否有趣的东西。 这可能是因为你正在运行Linux Out of Memory杀手,或者是进程在崩溃时抛出堆栈。 这两个都将在系统日志中可见。