在大量异构系统中pipe理日志？

在我工作的团队中，日志pipe理存在一个问题，我们使用数百个应用程序来pipe理超过100台具有异构系统的机器。

具有不同平台的异构系统：windows，linux，documentum，kofax，websphere，iis等。所有这些系统都有不同的日志格式和日志位置，一些在事件查看器中，大部分在单独的日志文件中。

有时很难弄清哪些机器安装在每个系统上，某些时候机器没有空闲空间，有时候没有简单的方法find日志所在的位置。

理想情况下，日志应该非常快，所以我们可以立即进行协作，减lessexception情况的停机时间。我们应该保留它们一段时间，所以非显而易见的问题是“后验”。并且必须确保可用磁盘空间，生产环境中的系统不应该停止。

你知道一个解决scheme和/或产品可以在这样的情况下帮助吗？

如果您可以通过SNMP使您想要logging的数据可用，那么可以使用诸如Zenoss Core或Nagios / Cacti等监视工具从每个系统中检索该SNMP数据，logging并绘制graphics，并在超过阈值时生成警报。关于SNMP的好处是它可以自由和跨平台地使用。 Zenoss Core也是免费且易于安装的。我们用它来监视只有六打服务器，但它可以扩展到数百个。某些function需要非自由企业版本。

像Splunk这样的工具是另一种select。这只是收集原始日志数据（您告诉您的服务器将其日志发送到您的Splunk服务器），索引它并使其可search。您可以创build报告，仪表板和警报。它需要更多的设置，不是免费的，但function强大，因为它是非常自由的forms，并且可以让你关联许多服务器上的事件。看看他们的演示video。

我很确定Nagios就是你想要去的地方。我们已经在我们的networking上设置了它，并且效果很好。

我们使用NetApp 2020的NFS挂载作为中央日志logging点 – 您仍然需要编写一些代码来查找问题，但至less它们都处于较less的位置。