18

我有一个小网站,我尝试将其镜像到我的本地机器,只有 html 文件,没有图像,图像附加文件...... pdf,..等。

我以前从未镜像过一个网站,我认为在做任何灾难性的事情之前问这个问题是个好主意。

这是我想要运行的命令,并且想知道是否应该添加其他任何内容。

wget --mirror <url> 

谢谢!

4

2 回答 2

24

和选项用于拒绝-R接受特定文件类型。-A

还要考虑用于下载整个网站的带宽。您可能还想添加该--random-wait选项。

如果您想跳过所有图像和 pdf,您的命令将类似于:

wget --mirror --random-wait -R gif,jpg,pdf <url>

注意:镜像一个网站可能会违反政策,所以我建议你先检查一下。

资料来源:

于 2013-08-29T16:44:30.557 回答
2

还有 wget 补丁添加了 mimetypes 过滤选项......

于 2014-01-18T13:37:12.060 回答