汇总来自cron和cfengine的电子邮件

最近,我接pipe了一个体面的networking(在10个物理站点上有900个FreeBSD或Linux主机),我们收到很多电子邮件,主要是从cfengine(v2)获得。 多年来我们也安装了很多cron作业,其中一些会不时地产生噪音(其中一些噪音会在每次运行中产生噪音!)多年来,团队中的系统pipe理员已经越来越接受这些信息,将它们过滤到/ dev / null,这样很less被读取。

显然这并不理想,我们应该解决所有的噪音 – 我们会的。 但首先我想做一些事情来围绕这个问题,并试图指出最“嘈杂”的程序,并保持统计电子邮件的数量,以便我们可以看到我们所做的变化的统计。

我想我会build立一台机器,接收这些电子邮件的副本,然后将它们处理成一个数据库,在那里我将运行统计我们得到的类似消息的重复数。 有很多预先存在的系统用于汇总传统的日志文件,但是唯一一个与我们之后的东西类似的是Sentry ,但是我将不得不编写一些处理的东西来使其工作。 如果没有这样的事情,我可以自己写一些东西。

有没有其他人遇到过这样的问题,并知道一个解决scheme来汇总大量的错误电子邮件报告并对其进行分析? 我在找:

  • 统计每小时或每天的电子邮件数量
  • 最常见的消息列表,按消息内容,主题或From:地址
  • 任何其他的统计信息都会指出简单的变化对消息量的影响

我不得不面对一个非常类似的问题。

在我的情况下,我从CFEngine收到不同的电子邮件,这取决于它们是来自从cron运行的cf-agent还是从cf-exec.d运行

我最终做的是删除cron cf-agent调用,并用一个简单的确保cfengine3服务正在运行的脚本replace它。

现在所有的电子邮件来自cf-execd,这使得我的电子邮件规则更好。 它并不完全符合你的要求,但它确实让我的一天更易于pipe理。