我正在使用Nagios来监视一定数量的服务器和进程保持在线状态。 这工作得很好,我很高兴。
不过,我希望在我inheritance并现在pipe理的服务器上整合一个“事件日志”。 事件主要是cron作业,但也可以用其他方式logging事件。 这就是现在大多数cron作业的设置:
### @hourly /backup/myscript.sh | mail -s "Myscript started" [email protected]
将不同服务器上的日志传送到一个地方的更好方法是什么? 也许我甚至可以loginNagios,然后点击“事件日志”标签,看到所有这些通知。
这不是取代脚本生成的实际日志文件(存储在服务器上)的替代方法,只是另一种方式来关注事物,并在事情不能正常工作时快速回顾。
我很乐意听到你们这样做或最佳做法的build议。
ps:我还应该提一下,我想改变这个的原因是因为每天有数以百计的电子邮件正在生成,这使得很难看到什么时候存在真正的问题。 我想我也想select将事件logging为“已完成”或“遇到的错误”或类似的东西,然后在出现问题时发送通知电子邮件。 也许我太希望了
nagios的确有一个监控仪表板。 在nagios的实际function是,你可以编写自己的自定义触发器通过电子邮件/ txt-message / phone-call / blinky-lights /无论你可以脚本…通知你任何问题/警告/错误。 还有一个web-gui,可以显示您在各种configuration中监控的所有内容…(即服务组…服务器…个人监视器等)
既然你可以通过编写自己的插件来使用Nagios,那么肯定有办法做到这一点。
例如,我使用Splunk来收集我的所有服务器,networking设备等的事件日志。使用一般的系统日志服务器或转储到数据库也可以做到这一点。
我在Splunk中设置了Nagios执行的search并执行警报逻辑。 我会build议,如果你想走这条路线,如何编写自定义插件的好感。 一旦你find了你想要添加到Nagios仪表板的内容。
如果您的目的是无需单独login每台服务器即可监控,您可以使用系统日志服务器将所有日志收集到一个位置。 这样你只需要在一个地方查看所有相关信息。
我会build议你看看LogZilla。 它可以让你logging一切,集中search,甚至创build图表/图表等。我们已经使用了大约一年,我真的很喜欢它。 也有小商店的免费许可证。