最近我工作的网站之一开始看到一些奇怪的urlstream量,这些stream量并不存在,也从来没有。
页面如:
实际上到目前为止,已经有超过300个不同的url了,其中没有一个与网站上的任何url类似。
所以自然,所有这些都redirect到我们的404页面,这恰好是我们的网站地图的修改版本。 麻烦的是,我们每天都会看到数以千计的404这些数字,恐怕这个数字会增长。 更重要的是,我查看了服务器日志,并没有发现所有这些stream量的通用IP地址。
所以我的第一个想法是修剪和简化404页面。 这是最小化服务器负载并降低带宽的第一步。
我也确信,这种stream量来自僵尸程序,某种恶意软件,或完全不感兴趣的用户,因为我已经使用我们使用的几个工具跟踪会话,并且他们在访问404页面之后从未实际使用该站点。
那么我还能做些什么来更好地检测这些stream量模式? 如果我可以做到这一点,这将是很好的。
看到这种“ 探测 ”是人们常常猜测是否存在特定的目录。 这是一种分析 ,其中某些页面的存在表明某些软件安装在服务器上,或某些用户名可能存在于服务器上,并且可能是其他types黑客的先驱。
我运行了一些网站,他们几乎每天都会看到这种探索。
他们来自不同的IP地址的事实可能表明,这个探测是通过一个僵尸networking进行的 – 特别是如果似乎有一个模式来探测各个IP地址。
没有什么可以阻止这件事的; 但是,通过提供一个非常简单的404页面 ,您绝对可以将对系统的影响降至最低。 这也可能是一个提醒,确保所有的软件修补和最新的,并且你有任何面向互联网的服务器上的强密码。
如果你有足够的公分母(比如/ impress / *和/ bnnrs1002 / *),那么你可以把一个重写模块放在其他地方发送这些请求。 例如,说一个非常小的自定义错误页面或其他一些“错误closures”页面。 这将有助于节省带宽,同时尝试将更强大的function放在适当位置。
那么如果他们真的只在每个IP地址上打了一次,对于所有不同的页面,那么真的没有什么可以做的,只是修剪404页面…或者你可以redirect到首页和将其声明为页面视图…;)