Intereting Posts

梭子鱼垃圾邮件过滤和贝叶斯学习

我遇到了来自BarracudasNetwork网站的最佳做法https://www.barracudanetworks.com/docs/other/barracuda_spam_&_virus_firewall_bayesian.pdf

这些build议build议在每种types的几百封电子邮件（有效的电子邮件和已知的垃圾邮件）的静态水平上保持高质量的贝叶斯学习样本。

这是我的问题 – 这样的configuration如何处理“季节性垃圾邮件时期”？我的意思是与世界性事件有关的垃圾邮件，例如与奥巴马有关的电子邮件，总统选举或Egipt的骚乱。我们注意到，在这些事件中，我们使用受限制的设置捕获的垃圾邮件中的不可见部分对事件有一定的参考。

现在，如果我们不断添加这些季节性垃圾邮件示例，我们最终会收到垃圾邮件样本中的数千封电子邮件。

我应该补充说，我们的邮件服务器每天收到数以万计的电子邮件。

处理上述情况的最佳方法是什么？

以下是我们一直在使用的（如果重要的话）：

非常感谢，卢克

请升级梭子鱼垃圾邮件filter的固件和操作系统版本！ （假设你有一个积极的订阅）

你错过了function。自从2009年的固件以来，已经有了大量的bug 。当前的修订版本是5.1.x版本。

在这里输入图像说明

BarracudaCentral数据库也将反映季节性垃圾邮件趋势，这应该是垃圾邮件filter的第一道防线。您不需要调整或修改阈值以适应世界事件。

我不会尝试学习每一封邮件。我保留大型客户端安装的贝叶斯数据库很小，也许有300-400个垃圾邮件和 HAM的例子。这就是你应该真正需要的。否则，你可能会中毒数据库。注意：你需要比HAM更多的垃圾邮件，比如下面的例子：

在这里输入图像说明

梭子鱼单位是基于SpamAssassin（不完全一样，但基于…）。我从来没有发现在SA中为贝叶斯filter保留旧的垃圾邮件样本有任何重要的价值。垃圾邮件无疑是“学习”，垃圾邮件看起来不像一年前那样。

保留一些火腿是一个好主意，尤其是如果你在金融，制药，医疗或类似的行业，你的火腿看起来很像垃圾邮件。贝叶斯filter将在这些情况下做的更好，如果你有两个例子（再次，使用当前的例子）…对我有用。