Google网页caching:尽pipe需要login才能泄露信息

一直在寻找疯狂的小时。

发生了什么:

当用Googlesearch某些关键字时,我使用了他们的站点预览function(在页面的图像表示中可以看到那个小小的popup窗口),它显示了Googlecaching的网页版本。

我一直认为Google只能查看匿名用户的网站内容。 我天真吗?

令我惊讶的是,这个caching版本显示的内容只有在网站用户login到我的网站时才在webbrowser中看到。 相关页面的URL是相同的,只有内容根据login的用户/匿名用户而变化。 更麻烦的是,只有当员工用户login时才能看到信息。

我在应用程序级使用Django / ModWSGI。 我三重检查了一个匿名用户将无法看到所述内容。

现在,除非Google可以访问我的网站的工作人员用户的login信息,并且在抓取我的网站(我觉得很难相信)的同时使用这个通知,这个原因应该在客户端的某个地方。

题:

是否有网页浏览器插件,将浏览的网站内容推到谷歌出于某种原因? 当然,在这种情况下,我想询问我的员工用户,但是这样做会更有成效,知道要寻找什么。 使用的客户端是Win / Mac / Ubuntu上的Firefox 3.x,IE 7/8,Win / Mac上的Safari。

我如何在这方面捍卫我的网站,以避免这种信息泄漏?

谢谢!

编辑

进一步的观察/信息:

我可以谷歌我的网站使用的关键字,通常只有某些工作人员的用户可见,因此我得出这样的结论,谷歌必须有关键字与我的网站存储在其数据库的地方(至less我不知道该怎么办) 。

我的网站上的网页caching版本大约一周(根据谷歌),当我查看这个caching版本时,search的关键字被突出显示,即使在网页浏览器清除自己的caching,而我目前还没有login到我的现场。

Google只对匿名访问的网站有访问权限。

您select的CMS 可能会向Google发送不同的内容,但这应该是可configuration的。 另外请记住,Google可能在内容公开的时候抓取了该网站,如果这个网站随后被隐藏起来,他们可能没有更新其索引。

我非常怀疑有这么一个浏览器插件可以把网站内容发送给Google。 没有用户login保护的机密网页的结束,如果保存了这些信息,Google就会有很多的热水,更不用说显示为search结果了。

清空您的浏览器的caching,然后尝试search或试图从未login到您的网站的机器上search,我敢打赌,search结果中不会有机密信息。

我认为这只是caching的信息(在本地电脑上),尤其是考虑到使用匿名信息可以看到URL和login页面上的“内容”。

一些新的事实浮出水面,导致解决案件。
也许这会帮助别人。

1)Google实际上已经在caching中表示了我可以在Google中查看的页面。 由于爬行只发生在匿名用户身上,信息泄露毕竟是服务器端发生的。

2)我缩小了信息泄漏到一个特定的页面(意味着Django的所有Django视图),可以通过不同的URL访问,只有用户名作为区别。

3)其他开发人员之一通过覆盖某个页面的服务器端variables而搞砸了。 通常持有访问该页面的用户的variables被其页面正在访问的用户覆盖。 如果您匿名访问了员工用户的页面,则可以看到不应该显示的信息。 🙁