我使用amavis和spamassassin后缀来过滤垃圾邮件,然后将所有内容都传递给交换服务器。 我经常收到没有被spamassassin捕获的邮件,更糟糕的是,他们自动学习火腿。
于是我开始收集这些邮件并以明文forms输出,并希望对这些邮件进行再培训,将其标记为垃圾邮件。
从我目前阅读的是,你不必指定任何你想“重新”训练一个邮件。 你应该运行--spam ,它应该忘记邮件火腿和训练它作为垃圾邮件。
但观察sa-learn --dump magic表演,它保持自动学习火腿入口,并将其添加到垃圾邮件。
我的想法是,Exchange以某种方式编辑邮件,以便在导出邮件并将邮件重新放回到后缀服务器时,邮件与以前不同。 情况会是这样吗? 如果是这样,有没有办法做我打算做的,例如通过删除一些头?
当你重新学习SpamAssassin,一个消息应该是垃圾邮件,它应该翻转消息从火腿到垃圾邮件或垃圾邮件。 问题是SpamAssassin了解您的中继主机上的消息,但是当它被转发到您的Exchange服务器时,由于添加了Received线,所以标题会有变化。 您可以尝试将以下内容添加到SpamAssassinconfiguration中:
bayes_ignore_header Received
这将使SpamAssassin在使用贝叶斯过滤时忽略Received头。 就个人而言,我并不真正赞成这一点,因为它限制了您的贝叶斯filter所能看到的以及我可以用来确定是否有火腿或垃圾邮件。
关于开启自动学习是您可能需要重新考虑的问题。 在大多数情况下,它会污染你的数据库,因为更多的火腿和垃圾邮件将被错误标记。 如果你想用最新的火腿和垃圾邮件来训练你的数据库,build立一个火腿和垃圾邮件账户可能是明智的,它们会接收到可信的消息,可以标记为火腿或垃圾邮件,并且每X小时/分钟学习一次。 但这是一个更困难的设置,需要一段时间才能正确工作。