我注意到我的一个网站没有正常工作,并给我500错误。 Nagios没有抓住它,因为HTTP服务器还在工作。
有没有一种方法可以告诉nagios检查我的网站的健康状况? 我想我只是写一个脚本,其中一些页面,并为它做一个cronjob。 错误,我会收到一封电子邮件,这样我的合适replace的时刻将是。
我正在运行debian linux
只需使用属于nagios-plugins软件包的check_http插件即可。 它可以监控网站的http状态,也可以监控其他http参数。
如果你想监视某个页面,并且你知道预期的状态,就像@Frank提到的那样, check_http插件可以这样做:
check_http -H domain.com -u URI -e 200 HTTP OK: Status line output matched "200" - 4886 bytes in 0.007 second response time |time=0.007446s;;;0.000000 size=4886B;;;0
但是,如果您希望在页面返回500错误时收到警报,我想您可以使用check_logfiles插件监控Apache的访问日志:
check_logfiles --tag=500 --logfile=/var/log/httpd/access_log --criticalpattern="HTTP/1.1\" 500"