如果来自一个来源的请求太多,许多大型站点将阻止访问。 但是大的提供者代理将展现类似的访问。 那么这些请求之间应该如何区分服务器呢? 而合法代理需要什么样的行为才能触发阻塞?
大多数网站检查开放代理,也许抓取一些代理列表,并检查各种黑名单。
然后随着时间的推移和滥用,pipe理员只是黑名单和/或扼杀IP块。 例如,如果您从中国获得大量的黑幕,而您的网站甚至没有针对他们,那么阻止来自其IP范围的stream量是相当普遍的做法( IANA , 这里是通过APNIClogging挖掘的人员名单) 。
在此之后,它归结为您运行的网站,这些用户可能对您的业务有多重要。 Google只是使用CAPTCHA来限制滥用资源,我相信如果必须的话,他们会采用更激烈的措施(甚至到了通过BGP改变ASpath)。
因此,如果您可以对IP后面的用户进行身份validation,并且他们的行为与正常使用情况一致,那么对于某些办公室来说,这可能只是一个透明的企业/公司代理。 (为了监控使用模式,您可以尝试使用某种根据您的需要定制的定制HTTPfilter的IPS / IDS。)
他们可能会将代理的IP地址添加到某种白名单中,以便stream量过滤软件忽略它们。
更普遍的问题是:“如何处理来自同一IP地址的恶意和良性stream量?”
除了开放代理(和付费代理)之外,还可以有一个合法的用户在不知不觉中还托pipe垃圾邮件机器人。 或者是一个大型的NAT公司,他们隐藏垃圾邮件机器人。 或者是向您发送垃圾邮件和真实用户的整个国家/地区。
这些也可以有不同的比例。 我运行的网站中的一些例子:到目前为止,我从Websense IP地址收到的所有stream量中有100%是垃圾邮件发送者,除了塞内加尔的一位客户之外,其余的都是垃圾邮件发送者。 另一方面,中国向我发送了25%的真实stream量和75%的垃圾邮件机器人。
阻止来自这些IP或networking块的所有请求将始终具有误报率,但是当您阻止IP地址时,您不必阻止所有请求。 如果您对博客评论或论坛垃圾邮件有问题,可以尝试限制来自违规IP地址的POST请求。
<Limit POST> Deny from 192.0.2.1 Deny from 198.51.100.2 Deny from 203.0.113.3 </Limit>
您可以使用IP地址作为您的垃圾邮件评分系统的一部分,而不是阻止IP地址。 如果您有针对垃圾邮件的贝叶斯评分系统,只需将用户的IP地址添加到令牌中即可。 总是垃圾邮件的地址将得到高分,地址不会得到低分,地址有两种types的用户(如代理)将徘徊在中间,使他们被判断的消息内容和不是他们的IP地址。
你甚至可以完全忽略IP地址,只是判断所有提交的内容,而不是IP地址的声誉。
虽然我自己也没有做过,但是你可以configurationfail2ban来读取你的垃圾邮件评分日志,并将最差的攻击者的IP地址放到一个.htaccess文件中,这样IP地址的禁止将在一定时间后过期。