我们使用ks-soft的Advanced Hostmonitor软件包来监视我们networking上的大约2000个项目。 我们觉得这很棒,支持它的人是太棒了,产品是快速,稳定和成熟的,但是我觉得随着公司的成长,我们开始在与后台pipe理系统整合方面出现一些摩擦点。
我们想要做的事情之一就是能够通过API向我们使用的任何监控工具添加新的testing。 例如,当服务器订单来自我们的零售界面时,服务器会自动生成,作为自动化构build过程的一部分,我们希望自动将新的testing添加到networking监控系统。
Hostmonitor通过一个称为HM Script的function对此有一些支持,但是我们开始遇到一些快速启动 –
但是我们所喜欢的关于hostmonitor的是行动档案。 例如,如果一个Windows IIS框变坏,我们的一个糟糕的testing的动作configuration文件就像这样:
我开始环顾其他networking监控工具,我正在寻找:
我看过Nagios和Icinga,但是我不能从他们的文档中收集是否可以使用这些特性,或者如果可以的话,实现/定制将涉及多less工作。
任何人都可以提供任何build议,指导或经验?
Icinga的工作非常好(我更喜欢Nagios,因为它有一个可用于获取数据的API,并且与Nagios插件100%兼容)。
有一个关于Nagios VS Icinga的video,描述得非常好: Youtube (It's by Icinga,所以小心谨慎)
您可以使用Icinga来发送/短信给某人,甚至运行一个脚本(因此,重新启动一个服务,重启,…)例如: 链接 (这是一个nagios链接,但它是相同的交易)。
唯一我不确定的是按照时间顺序运行命令。
为了使configuration更容易,我们使用NConf 。 它提供了一个主机,服务,…(不是用户pipe理)的API。
根据您的环境,您可能希望查看一个甚至不使用探针的解决scheme,而只是分析stream量,然后根据类似的情况设置警报,例如,如果您看到500级错误或stream量持续一段时间内骤然下降。 例如,看看ExtraHop提供的function: http : //www.extrahop.com/
如果你正在寻找外部监测,你可能想看看WatchMouse。 他们的API提供你提到的function(如果我理解你是正确的): apidoc.watchmouse.com
干杯马克
Opsview有一个API: http ://docs.opsview.com/doku.php?id=opsview3.0:api