我试图用wget获得一个网站镜像,并遇到了一个奇怪的行为。
假设我用以下方式镜像一个名为www.example.com的内部网站,所有这些网站似乎都工作正常:
wget -mkE http://www.example.com
但是,因为我需要通过IP访问服务器,而不是域名,我尝试着:
wget -mkE -D www.example.com --header "Host: www.example.com" http://IPv4_ADDR
但在这种情况下,它只下载第一页并退出。
任何想法?
当您使用wget与http唯一的方式,它可以确定什么是在同一网站是通过检索页面中的链接。 根据这些链接的创build方式(绝对或相对),当你通过IP地址获取的时候,这些链接看起来可能是外部的,在这种情况下,链接不会跟随它们。