Check_MK:我如何根据服务组创build通知,而不仅仅是一个服务?

我希望能够根据一组服务的可用性创build通知,而不仅仅是一个阈值。 例如,假设我有10台AWS服务器都做同样的事情,而且我希望其中的一些服务器有时会超载/失败,而不会损害应用程序:我希望Check_MK通知我,如果10个服务器中有3个(或更高)在给定的服务中失败。 如果失败了,不要通知我。 另一个例子,也许更简单:假设你在同一台NFS服务器上有20台服务器上的NFS挂载点。 我不想得到20个警告或批评。

上述在我的环境中的例子已经分组在服务组。

我在Check_MK 1.2.6p16中尝试了三种不同的机制:

  1. 使用商业智能。 分组和警告设置是太棒了,它做了我想要的! 但是通知规则不允许任何与产品的BI组件有关的任何事情!

  2. 群集 – 我为AWS服务器设置了一个群集,但是由于我的一些检查(最主要是我的HTTP活动检查)需要一个主机名,这没有任何帮助。 我不认为Cluster是一个正确的拉比博士,但是如果我错了,请纠正我的错误。 我放弃了看这个。

  3. 服务组警示 – 这个原始问题的目的。 通知逻辑中没有任何东西可以让我警告服务组的可用性。

任何人用Check_MK完成这个?

NFS示例将会非常棘手,因为跨主机服务依赖关系无法自动pipe理。 你需要一个解决方法。 你可以正确地监视导出和nfs服务(有一个nfsexports检查,你也可以尝试检查rpcinfo连接)如果防火墙失败,它会留下一个空白,但是如果你很好的监视nfs,那么重点放在服务器上。

1)商业智能不直接提醒,有一个check_bi_aggr,你需要build立警报。 (使用它将生成的服务名称)。 因此,通知规则需要为此configuration。 它应该迅速提醒,如果你达到3/10大关。

然后应该修改个别服务的通知。 即你设置他们不通知很长的时间。 即通过通知延迟。

2)多半没用,直到最后一个失败

3)基本上是一个Nagios的限制,忘了这个。