具有APIfunction的networking监控工具

我们使用ks-soft的Advanced Hostmonitor软件包来监视我们networking上的大约2000个项目。 我们觉得这很棒,支持它的人是太棒了,产品是快速,稳定和成熟的,但是我觉得随着公司的成长,我们开始在与后台pipe理系统整合方面出现一些摩擦点。

我们想要做的事情之一就是能够通过API向我们使用的任何监控工具添加新的testing。 例如,当服务器订单来自我们的零售界面时,服务器会自动生成,作为自动化构build过程的一部分,我们希望自动将新的testing添加到networking监控系统。

Hostmonitor通过一个称为HM Script的function对此有一些支持,但是我们开始遇到一些快速启动 –

  1. 我们不能添加新的运营商/用户
  2. 我们无法定义新的“动作configuration文件” – 这是testing好坏时要采取的行动。

但是我们所喜欢的关于hostmonitor的行动档案。 例如,如果一个Windows IIS框变坏,我们的一个糟糕的testing的动作configuration文件就像这样:

  • 再次检查主机(一次)
  • 再等待30秒,然后再次testing
  • 尝试重新启动远程计算机上的应用程序池(最多两次)
  • 发送电子邮件给ops关于重启失败
  • 尝试在远程计算机上重新启动IIS(最多四次)
  • 页面值classpipe理员(最多5次 – 值class后pipe理员确认提醒)
  • 页面备份任务pipe理员(5次 – closures后pipe理员确认提醒)

我开始环顾其他networking监控工具,我正在寻找:

  1. 一个全面的API能够添加/删除/控制testing/testing“动作configuration文件”/运营商(不只是插件,我们需要控制和pipe理界面)
  2. 能够具有相当详细的行动/升级configuration文件(并通过API定义这些)

我看过Nagios和Icinga,但是我不能从他们的文档中收集是否可以使用这些特性,或者如果可以的话,实现/定制将涉及多less工作。

任何人都可以提供任何build议,指导或经验?

Icinga的工作非常好(我更喜欢Nagios,因为它有一个可用于获取数据的API,并且与Nagios插件100%兼容)。

有一个关于Nagios VS Icinga的video,描述得非常好: Youtube (It's by Icinga,所以小心谨慎)

您可以使用Icinga来发送/短信给某人,甚至运行一个脚本(因此,重新启动一个服务,重启,…)例如: 链接 (这是一个nagios链接,但它是相同的交易)。
唯一我不确定的是按照时间顺序运行命令。

为了使configuration更容易,我们使用NConf 。 它提供了一个主机,服务,…(不是用户pipe理)的API。

根据您的环境,您可能希望查看一个甚至不使用探针的解决scheme,而只是分析stream量,然后根据类似的情况设置警报,例如,如果您看到500级错误或stream量持续一段时间内骤然下降。 例如,看看ExtraHop提供的function: http : //www.extrahop.com/

如果你正在寻找外部监测,你可能想看看WatchMouse。 他们的API提供你提到的function(如果我理解你是正确的): apidoc.watchmouse.com

干杯马克

Opsview有一个API: http ://docs.opsview.com/doku.php?id=opsview3.0:api