您是否还要手动监控服务器以及自动监控?

我今天和一位同事讨论了这个问题,我提到服务器如何不以手动的方式主动监控(例如,rdp到随机服务器,并进行一些手动检查 – 这将与正确的自动化监控相结合,但是我们不有那个)。

作为系统和服务器pipe理的最佳实践 – 您是否build议每天手动检查服务器以及自动监控?

作为系统和服务器pipe理的最佳实践 – 您是否build议每天手动检查服务器以及自动监控?

总之,没有。

您的监控系统必须足够全面,以监控每个系统提供的每项关键服务。

为什么? 手动监视只是普通不能缩放。 如果你有5台服务器,这是一回事,但是当你把这台服务器扩展到50台或500台时,你会怎么做? 您不希望支付您的系统pipe理员每天通过和捅巨大的服务器列表。

我绝对不会build议 – 除了作为一个练习,以确定您的自动监测不足之处。

为什么? 简单 – 人们感到无聊,忘记的东西。 机器不。 因此,如果您手动检查某些内容以确保服务器正在运行,请编写一个脚本来执行相同的操作,并让服务器按常规方式调用它。

如果您的软件监控解决scheme运行良好,我不认为有理由做“抽查”。 也就是说,我们每天至less在我们的数据中心周围做一圈,看是否有任何琥珀灯闪烁,监视器可能错过了。 如果你可乐,这可能是不可行的。 对我而言,一天只需要5分钟左右的时间。

我也没有真正看到手动检查的东西点。 它没有规模,这样做似乎很麻烦。

实际上,思考什么才是真正需要监控的东西。 就像没有必要监视一台机器上的每一项服务一样,它只是浪费了stream量,毫无意义地增加了负载。 把它放在重要的东西。 磁盘,Raid,一两个重要的服务,最重要的是日志文件。 我倾向于认为在优化日志文件审计方面做得很好,可以节省大量工作和时间