2

我一直在尝试使用 HTTrack 来镜像单个页面(下载 html + 先决条件:样式表、图像等),类似于问题 [使用 httrack 镜像单个页面] [1]。但是,那里接受的答案对我不起作用,因为我使用的是 Windows(wget“存在”但实际上是一个包装器,Invoke-WebRequest并且功能完全不同)。

HTTrack 真的想要(a)下载我指向的整个网站,或者(b)只下载我指向的页面,让所有图像仍然存在于网络上。有没有办法让 HTTrack 下载仅足以离线查看单个页面 - 相当于wget -p

4

3 回答 3

1

这是一篇旧帖子,所以您现在可能已经弄清楚了。我刚刚看到您的帖子,正在寻找有关使用 Python 和 HTTrack 的另一个答案。我遇到了同样的问题,我通过了参数 -r2 并下载了图像。

我的论点基本上是这样的: cmd = [httrack, myURL,'-%v','-r2','-F',"Mozilla/5.0 (Windows NT 6.1; Win64; x64)",'-O',保存位置]

于 2016-12-20T18:11:58.687 回答
0

这个答案对我有用。

下载了包含所有先决条件的单页 html。只需尝试提供要下载的页面的确切链接,如上面的答案所示,使用 GUI,在“-Mirroring Mode-”->“Set Options”->“Limits”->“Maximum External Depth = 0”。

于 2021-08-05T07:38:21.797 回答
-1

使用浏览器保存页面应下载该页面及其所有先决条件。

于 2019-12-01T15:34:45.580 回答