如何扫描我的文件夹的网站？像一个爬虫？

我想扫描我的网站上的所有url，以及获取其中的文件，但事情是，有太多的我手动做这个，我怎么会这样做？

无论如何，只要存在某种types的顺序，我就会喜欢它的格式。

例如：URL / FOLDER URL / FOLDER / FILE URL / FOLDER / FILE2 URL / FOLDER2 / FILE

所有文件都像.txt文件

我该怎么做？

尝试通过-R开关的ls 。它列出了子目录。这里是一个例子：

 ls -R /path/to/whatever > folders.txt

如何扫描我的文件夹的网站？ 像一个爬虫？