Exim mainlog字符编码

在我的exim4安装中,我一直得到UTF-8编码和扩展的ANSI编码的mainlog,其中包含像“tämä”(正确使用UTF-8)和“t \ xe4 \ m \ xe4”(ANSI)的string。 后面的转义标记是单字节代码,为了清楚起见,转义完成(“字符”编码为74 EC 6D EC,以字节为单位)。 当然,今天的默认值是UTF-8,大部分线路都正常。

问题在于,这会混淆fail2ban,因为它期望日志文件以一致的方式进行编码。 但是,我不能selectANSI或UTF-8,因为这两种编码都存在于日志文件中。

我想知道在将stringlogging到/ var / log / exim / mainlog之前是否有办法过滤掉ANSI字符?

至于罪魁祸首,它可能是Windows机器上的一个古老的垃圾邮件软件或一些旧的群发邮件应用程序。 无论如何,大约35-45%的日志线似乎每天都被ANSI污染。