最近,我接pipe了一个体面的networking(在10个物理站点上有900个FreeBSD或Linux主机),我们收到很多电子邮件,主要是从cfengine(v2)获得。 多年来我们也安装了很多cron作业,其中一些会不时地产生噪音(其中一些噪音会在每次运行中产生噪音!)多年来,团队中的系统pipe理员已经越来越接受这些信息,将它们过滤到/ dev / null,这样很less被读取。
显然这并不理想,我们应该解决所有的噪音 – 我们会的。 但首先我想做一些事情来围绕这个问题,并试图指出最“嘈杂”的程序,并保持统计电子邮件的数量,以便我们可以看到我们所做的变化的统计。
我想我会build立一台机器,接收这些电子邮件的副本,然后将它们处理成一个数据库,在那里我将运行统计我们得到的类似消息的重复数。 有很多预先存在的系统用于汇总传统的日志文件,但是唯一一个与我们之后的东西类似的是Sentry ,但是我将不得不编写一些处理的东西来使其工作。 如果没有这样的事情,我可以自己写一些东西。
有没有其他人遇到过这样的问题,并知道一个解决scheme来汇总大量的错误电子邮件报告并对其进行分析? 我在找:
我不得不面对一个非常类似的问题。
在我的情况下,我从CFEngine收到不同的电子邮件,这取决于它们是来自从cron运行的cf-agent还是从cf-exec.d运行
我最终做的是删除cron cf-agent调用,并用一个简单的确保cfengine3服务正在运行的脚本replace它。
现在所有的电子邮件来自cf-execd,这使得我的电子邮件规则更好。 它并不完全符合你的要求,但它确实让我的一天更易于pipe理。