有没有什么好的软件来监测一系列相关软件的健康状况?
要求如下:
举个例子,假设我们有一个每天早上6点的日常出口。 导出完成后,会发送一条状态消息,表示已完成,并传递某种应用程序密钥以标识导出。 如果这个状态信息没有进入,比如说上午6点30分,那么可能会发送一封电子邮件,该应用程序应该在仪表板上等红色。
应用程序也应该能够发布错误/警告消息。
基本上,我们的目标是能够从一个系统监控我们所有的内部项目,而不是大量的电子邮件,日志文件等。
我怀疑我可能不得不从头开始写这个,但我只是想我会问。
Nagios就是你想要的一切。 有点难以正确configuration,但工作很好。 不要为此编写自己的软件,Nagios已经这样做了,而且做得非常好。
与在Nagios上发布消息有关,您可以使用NSCA作为本地远程或简单脚本。
尝试使用Failsafe。 它监视服务器ping和web服务器的html请求。 然后它发送一个警报,并可以运行一个脚本。 https://sites.google.com/site/bigsoftwarecreations/home/failsafe
OpenNMS也很酷:)作为@Sacx写道:NagiOSconfiguration有点困难。