使用Nagios事件处理程序将系统恢复到正确的状态

我很新的监测,configurationpipe理等,所以请裸露在我身边。

我已经阅读了像Ansible和SaltStack这样的configurationpipe理/configuration工具。 这些对我来说听起来不错,我打算使用其中的一个(还没有决定哪一个我倾向于Ansible)。 理想情况下,我想使用这两者来控制系统中的configuration和命令执行的所有方面。 即:从最初的引导,特别的命令,而且当系统范围的exception发生时。

为此,我似乎可以使用Nagios事件处理程序(正确设置时)依次执行已configuration好的剧本(或者等价的盐水图)来尝试将系统恢复到正确的状态。

这个设置是否经常被使用? 任何理由,这不是一个好主意?

我在问,因为在1个工具(ansible或saltstack)下configuration所有configuration似乎合乎逻辑/方便,但是如上所述使用Nagios(或类似的)和Ansible(或类似的)的组合信息似乎是真的稀疏/ 不存在的。

谢谢。

这是一个合理的想法,但是你必须非常小心,你的自动化操作是精确和准确的。

您需要绝对确保您遇到的故障状态可以通过自动操作来重置(准确)。

您还需要确保您的操作完全幂等,以防出现问题,并导致错误的重新configuration服务。 (精确)。

这不是一个坏主意,所有的一起,但围绕国家皮瓣的问题是那些会最快抓住你的问题。 从经验来看,他们甚至能够抓住我,我已经自动地重新启动了一些东西,而没有意识到它被卡住了(或者依赖于你的观点)。