使用wgetrecursion下载时错误的文件名编码/解码

当我下载一个指定完整path+文件名的文件时,我使用wgetrecursion地从远程目录下载文件,创build文件夹和文件的人,使用特殊字符(如èÓ ,文件正确下载,但是当我尝试使用选项-r下载包含所有文件和目录的文件夹时,文件名不会被正确编码或解码。

从我所搜集的内容来看,文件名在请求中是以ascii的forms发送的,而且我的机器和服务器都在$PATH上有UTF-8编码,所以它也不是问题。

当wget创build文件时,文件名中的è字符(我将用作示例)将保存为八进制字符代码中的\350 ,并显示为一个è 。 这只发生在recursion下载文件时,如果我使用完整的URL下载这个文件,文件名显示正确。

我已经花了相当多的时间在这里和那里查询Q / A,并且我已经尝试了我所见过的一切,从设置--local-encoding--remote-encodingUTF-8--restrict-file-names=nocontrol

端口21和22是closures的,所以我不能通过SCP或FTP下载文件,很可能任何其他协议下载文件都会给出同样的错误,但我可以使用任何不常见的,我可以使用。

我也有这个主要的问题是,当我下载文件,当我尝试将它们复制到备份文件夹,有些文件有时会给我一个错误的文件没有find由于文件名被搞乱,现在即时通讯使用--restrict-file-names=ascii并保留--restrict-file-names=ascii的名称作为解决方法,但我需要将编码更改为UTF-8 ,我也不能在机器上安装任何应用程序,如convmv来自老板的订单)。

这是我一直用来下载文件的命令: wget --keep-session-cookies --cookies=on --no-check-certificate --restrict-file-names=nocontrol --convert-links --no-parent -r <URL>

这是如何保存文件名与recursion下载单个文件与所有文件:

OT14-004 CEIP Pins del Vallès.vsd

OT14-004 CEIP Pins del Vallès.vsd

我正在使用这台发行版的CentOS Linux release 7.0.1406 (Core)并与此版本的wget GNU Wget 1.14 built on linux-gnu