Apache日志充斥着连接 – “(通过ggpht.com GoogleImageProxy)”

我的服务器运行在100%的CPU上,看着Apache日志,我看到成千上万的连接如下所示:

10.190.45.31 - - [13/Mar/2014:15:29:02 +0000] "GET SOMETHING HTTP/1.1" 200 2261 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 (via ggpht.com GoogleImageProxy)" 

IP是我的负载平衡器,不幸的是我没有设置日志logging,所以我不能确定这个请求的真实来源。

有谁知道这是什么样的stream量?

我也看到这样的交通。

  • IP地址始终在66.249.64.0/19范围内,由Google拥有。
  • 我看到的用户代理总是和你在那里一样。
  • 被请求的URL主要是图像,但有时不是。
  • 大多数图片url被多次请求。 前两个最需要的图像(顺便说一下,我们只包含在我们的平台发送的电子邮件中)是总请求的2/3。

我非常肯定,这与他们最近对Gmail进行的更改有关, 以便自动将电子邮件加载到电子邮件中,但通过代理进行加载则无法识别收件人。

这个博客文章支持我,并包含相同的用户代理。

你也许可以通过给自己发一个HTML邮件到你的Gmail地址来testing这个,这个地址包括这样的标签(当然你的域名replace为example.com ):

 <img src="http://example.com/this_probably_doesnt_exist.jpg"> 

如果您从该用户代理中看到与该URL相同的点击,则我猜对了。