在我工作的团队中,日志pipe理存在一个问题,我们使用数百个应用程序来pipe理超过100台具有异构系统的机器。
具有不同平台的异构系统:windows,linux,documentum,kofax,websphere,iis等。所有这些系统都有不同的日志格式和日志位置,一些在事件查看器中,大部分在单独的日志文件中。
有时很难弄清哪些机器安装在每个系统上,某些时候机器没有空闲空间,有时候没有简单的方法find日志所在的位置。
理想情况下,日志应该非常快,所以我们可以立即进行协作,减lessexception情况的停机时间。 我们应该保留它们一段时间,所以非显而易见的问题是“后验”。 并且必须确保可用磁盘空间,生产环境中的系统不应该停止。
你知道一个解决scheme和/或产品可以在这样的情况下帮助吗?
如果您可以通过SNMP使您想要logging的数据可用,那么可以使用诸如Zenoss Core或Nagios / Cacti等监视工具从每个系统中检索该SNMP数据,logging并绘制graphics,并在超过阈值时生成警报。 关于SNMP的好处是它可以自由和跨平台地使用。 Zenoss Core也是免费且易于安装的。 我们用它来监视只有六打服务器,但它可以扩展到数百个。 某些function需要非自由企业版本。
像Splunk这样的工具是另一种select。 这只是收集原始日志数据(您告诉您的服务器将其日志发送到您的Splunk服务器),索引它并使其可search。 您可以创build报告,仪表板和警报。 它需要更多的设置,不是免费的,但function强大,因为它是非常自由的forms,并且可以让你关联许多服务器上的事件。 看看他们的演示video。
我很确定Nagios就是你想要去的地方。 我们已经在我们的networking上设置了它,并且效果很好。
我们使用NetApp 2020的NFS挂载作为中央日志logging点 – 您仍然需要编写一些代码来查找问题,但至less它们都处于较less的位置。