试图在大型(〜80节点)集群上创build一个http服务检查的集群检查。 我希望它在非正常状态下警告40多个节点,在非正常状态下暴击60多个节点。
命令定义是:
define command { command_name check_cluster command_line $USER1$/check_cluster --service -l $ARG1$ -w $ARG2$ -c $ARG3$ -d $ARG4$ }
服务定义是:
define service { name Laborer Clutser check service_description laborer_cluster hostgroup_name laborer_cluster use generic-http-1min check_command check_cluster!@40!@60!"laborer cluster"!$SERVICESTATEID:cs01:laborer-http$,$SERVICESTATEID:cs02:laborer-http$,$SERVICESTATEID:cs03:laborer-http$,..$SERVICESTATEID:csNN:laborer-http$
但由于某种原因,只有一个主机处于非正常状态,它会发生WARN:
警告一个不好的