大型网站如何在代理和滥用之间做出决定？

如果来自一个来源的请求太多，许多大型站点将阻止访问。但是大的提供者代理将展现类似的访问。那么这些请求之间应该如何区分服务器呢？而合法代理需要什么样的行为才能触发阻塞？

大多数网站检查开放代理，也许抓取一些代理列表，并检查各种黑名单。

然后随着时间的推移和滥用，pipe理员只是黑名单和/或扼杀IP块。例如，如果您从中国获得大量的黑幕，而您的网站甚至没有针对他们，那么阻止来自其IP范围的stream量是相当普遍的做法（ IANA ，这里是通过APNIClogging挖掘的人员名单）。

在此之后，它归结为您运行的网站，这些用户可能对您的业务有多重要。 Google只是使用CAPTCHA来限制滥用资源，我相信如果必须的话，他们会采用更激烈的措施（甚至到了通过BGP改变ASpath）。

因此，如果您可以对IP后面的用户进行身份validation，并且他们的行为与正常使用情况一致，那么对于某些办公室来说，这可能只是一个透明的企业/公司代理。（为了监控使用模式，您可以尝试使用某种根据您的需要定制的定制HTTPfilter的IPS / IDS。）

他们可能会将代理的IP地址添加到某种白名单中，以便stream量过滤软件忽略它们。

更普遍的问题是：“如何处理来自同一IP地址的恶意和良性stream量？”

除了开放代理（和付费代理）之外，还可以有一个合法的用户在不知不觉中还托pipe垃圾邮件机器人。或者是一个大型的NAT公司，他们隐藏垃圾邮件机器人。或者是向您发送垃圾邮件和真实用户的整个国家/地区。

这些也可以有不同的比例。我运行的网站中的一些例子：到目前为止，我从Websense IP地址收到的所有stream量中有100％是垃圾邮件发送者，除了塞内加尔的一位客户之外，其余的都是垃圾邮件发送者。另一方面，中国向我发送了25％的真实stream量和75％的垃圾邮件机器人。

阻止来自这些IP或networking块的所有请求将始终具有误报率，但是当您阻止IP地址时，您不必阻止所有请求。如果您对博客评论或论坛垃圾邮件有问题，可以尝试限制来自违规IP地址的POST请求。

 <Limit POST> Deny from 192.0.2.1 Deny from 198.51.100.2 Deny from 203.0.113.3 </Limit>

您可以使用IP地址作为您的垃圾邮件评分系统的一部分，而不是阻止IP地址。如果您有针对垃圾邮件的贝叶斯评分系统，只需将用户的IP地址添加到令牌中即可。总是垃圾邮件的地址将得到高分，地址不会得到低分，地址有两种types的用户（如代理）将徘徊在中间，使他们被判断的消息内容和不是他们的IP地址。

你甚至可以完全忽略IP地址，只是判断所有提交的内容，而不是IP地址的声誉。

虽然我自己也没有做过，但是你可以configurationfail2ban来读取你的垃圾邮件评分日志，并将最差的攻击者的IP地址放到一个.htaccess文件中，这样IP地址的禁止将在一定时间后过期。