我正在寻找一个工具,在那里我可以列出服务器来检查文件的位置,它会返回这些服务器上最常见的错误列表(比如2或3台服务器,以简化报告)并获取报告像这样的东西
Server.A Server.B Server.C -------- -------- -------- 42 error.X 39 error.X 61 error.X 21 error.Y 7 error.Y 5 error.A 17 error.B 6 error.A 4 error.Y 4 error.A 2 error.R 3 error.S 3 error.R 1 error.S 1 error.R
当然,不包括时间戳和其他错误细节,只是把常见的子string弄清楚,然后像这样列出来。 我可以看看表格,看到这个错误.B对于Server.A来说是唯一的,并且认为Server.A有一些东西。 这样的事情已经存在了吗? 这是我必须自己编码吗?
我不一定要查找这个特定的报告,只是在一组错误日志中查找唯一错误的function。
这听起来像你需要事件关联 。 请参阅免费的简单事件关联器 。
Splunk和logstash也可能提供您需要的一些日志分析和关联。 Splunk只能用于非常有限的使用,而logstash是开源的。
无论你走什么路线,都应该调查集中式日志logging,并将所有日志收集到专用的日志服务器上,以便进行这种分析,而无需先连接到远程系统。