python - 使用 HTTrack 镜像单个页面

Question

我一直在尝试使用 HTTrack 来镜像单个页面（下载 html + 先决条件：样式表、图像等），类似于问题 [使用 httrack 镜像单个页面] [1]。但是，那里接受的答案对我不起作用，因为我使用的是 Windows（wget“存在”但实际上是一个包装器，Invoke-WebRequest并且功能完全不同）。

HTTrack 真的想要（a）下载我指向的整个网站，或者（b）只下载我指向的页面，让所有图像仍然存在于网络上。有没有办法让 HTTrack 下载仅足以离线查看单个页面 - 相当于wget -p？

score 1 · Accepted Answer

这是一篇旧帖子，所以您现在可能已经弄清楚了。我刚刚看到您的帖子，正在寻找有关使用 Python 和 HTTrack 的另一个答案。我遇到了同样的问题，我通过了参数 -r2 并下载了图像。

我的论点基本上是这样的： cmd = [httrack, myURL,'-%v','-r2','-F',"Mozilla/5.0 (Windows NT 6.1; Win64; x64)",'-O',保存位置]

score 0 · Accepted Answer

这个答案对我有用。

下载了包含所有先决条件的单页 html。只需尝试提供要下载的页面的确切链接，如上面的答案所示，使用 GUI，在“-Mirroring Mode-”->“Set Options”->“Limits”->“Maximum External Depth = 0”。

score -1 · Accepted Answer

-1

使用浏览器保存页面应下载该页面及其所有先决条件。

于 2019-12-01T15:34:45.580 回答

python - 使用 HTTrack 镜像单个页面

3 回答 3

Related

Reference