如何扫描我的文件夹的网站? 像一个爬虫?

我想扫描我的网站上的所有url,以及获取其中的文件,但事情是,有太多的我手动做这个,我怎么会这样做?

无论如何,只要存在某种types的顺序,我就会喜欢它的格式。

例如:URL / FOLDER URL / FOLDER / FILE URL / FOLDER / FILE2 URL / FOLDER2 / FILE

所有文件都像.txt文件

我该怎么做?

尝试通过-R开关的ls 。 它列出了子目录。 这里是一个例子:

 ls -R /path/to/whatever > folders.txt