我知道wget可以获取远程页面及其依赖关系,并重写html,以便图像src属性引用新下载的图像。 我试图转换在互联网上引用图像的本地HTML文件。 我在用着 wget –mirror –page-requisites –convert-links \ –directory-prefix=foo \ –force-html \ –input-file=my_file.html 所有引用的图像都下载到foo/的相应位置,但是my_file.html中的src属性没有被更改。
我试图创build一个PHP应用程序的静态镜像(特别是一个旧的PHP画廊安装)。 该应用程序产生的URL如下: view_album.php?set_albumName=MyAlbum wget直接将这些文件下载到名称相同的文件中,并带有问号。 为了不打破入站链接,我想保留这些名称。 但是,我如何为他们服务呢? 我遇到了两个问题: Web服务器(正确)尝试查找“view_album.php”,并将查询parameter passing给它,而不是find一个带有问号的文件。 如何告诉Web服务器在其中查找带有问号的文件? 重命名文件是不可取的,因为它会打破入站链接。 我无法告诉入站链接器%编码它们的URL。 这些文件不以HTML结尾,所以大多数networking服务器不会发送html内容types的头文件。 我应该寻找什么样的configuration参数来告诉它为一个目录中的所有文件强制使用“text / html”内容types还是匹配某种模式? 我最终使用lighttpd,但如果你知道什么样的configuration可能会得到与Apache / Nginx所需的结果我也很想听到。
我们目前有三个networking服务器。 服务器一和二的行为,但我有第三个真正的问题。 wget , curl和yum都无法build立连接 – 也就是说,在parsing主机并尝试连接之后,它们全部挂起。 例子(我尝试了很多不同的url): # wget http://rpm.pbone.net/index.php3/stat/4/idpl/13941547/dir/centos_5/com/httpd-2.2.3-43.el5.centos.i386.rpm.html –2010-09-02 20:00:26– http://rpm.pbone.net/index.php3/stat/4/idpl/13941547/dir/centos_5/com/httpd-2.2.3-43.el5.centos.i386.rpm.html Resolving rpm.pbone.net… 85.14.85.4 Connecting to rpm.pbone.net|85.14.85.4|:80… 挂起 # curl -v http://rpm.pbone.net/index.php3/stat/4/idpl/13941547/dir/centos_5/com/httpd-2.2.3-43.el5.centos.i386.rpm.html * About to connect() to rpm.pbone.net port 80 * Trying 85.14.85.4… 挂起 #yum -d9 update Loading "fastestmirror" plugin Config time: 0.052 Running "init" handler for "fastestmirror" plugin Yum Version: 3.2.22 […]
我一直在和我的互联网服务提供商讨论他们提供的服务。 主要是关于吞吐速度。 我已经build立了一个边缘路由器(参见下面列出的硬件细节),并且已经build立了以下testing来定期(通过cron)获得速度: wget –no-cache –output-document=/dev/null -a /opt/result.txt http://speedtest.wdc01.softlayer.com/downloads/test10.zip Cacti被设置并被configuration为从这个脚本获取输出并直接显示,没有明显的修改。 (我是仙人掌新手。) 仙人掌也有图表configuration显示stream量进出两个接口的bps,这里是我的问题在哪里(躺?)…这里是我困惑的地方: 早些时候,testing速度为〜200Kb / s。 不是很好..没死。 但是当我看到入站(下载)的stream量bps时,它显示的最大速率> 1.4 Mb / s。 我如何阅读这两个看似矛盾的数据来做出准确的陈述? 我在某处是否错误地configuration了报告图表,还是只是误解了我面前的情况? Hardware — Dell PRECISION WS340 Linux servername 2.6.18-308.8.1.el5 #1 SMP Tue May 29 14:57:06 EDT 2012 i686 i686 i386 GNU/Linux # WAN Port eth0 Link encap:Ethernet HWaddr 00:06:5B:DD:37:D9 inet addr:192.168.100.100 Bcast:192.168.100.255 Mask:255.255.255.0 […]
我试图执行这样的事情: wget –user=foo –password=bar! url 那! 在密码是造成问题。 我已经尝试用\来转义它,如 –password=bar\! 我试过封装在单引号和双引号中。 我把密码放在一个单独的文件中,然后尝试 –password = cat pass.txt 每一次,我得到一个403禁止。 使用-d,我看到SSL握手成功。 在Windows命令行上,该命令起作用。 我的假设是我需要逃避! 不同,但我不知道怎么回事。
当我从命令行运行curl curl "https://example.com" 它立即成功,返回请求的结果。 当我运行相同的wget命令 wget https://example.com 它最终超时与“无法build立SSL连接”。 没有任何具体的错误信息。 它连接,但不能做SSL握手。 我尝试了–no-check-certificate但没有任何区别 – 它似乎是超时相关的。 然而: wget http://example.com 工作正常(HTTP与HTTPS)。 这也影响了PHP的“ file() ”方法调用。 我的问题是,什么会导致curl成功检索一个页面(对于我们的域名中的所有网站),而不是wget或php解释器? 这是周末的一个新问题,服务器之前是好的。 (操作系统是Red Hat Enterprise Linux 6.4)
比方说,我有一个文件有很多url,我想要使用任意数量的进程并行下载它们。 我怎样才能用bash做到这一点?
当我用wget下载一个大文件时,它给了我“56M / s”。 我想知道这是否意味着每秒56兆比特或每秒56兆字节。 谢谢! 喜欢这个: 231,997,440 61.4M/s in 4.0s
使用wget获取文件时出现以下错误: Issued certificate not yet valid. To connect to www.atlassian.com insecurely, use '–no-check-certificate'. 使用openssl进行testing会返回类似的消息: Verify return code: 9 (certificate is not yet valid)
wget“ http://flakejfl2ke3jrlwkefj38j2ofiwejfoifjalsdkfje3fklwje.exe ”很长。 我如何将它保存为我自己的名字?