5

我尝试使用httrack下载我的 phpbb 论坛,但无论我使用什么设置,我都无法停止下载整个 wikipedia 站点以及许多其他链接在论坛中任何位置的网站......

我设法让它只下载索引页面但这也不好。

我以为设置

+forum.mysite.com/*

在 Options->Scan Rules 中可以解决问题,但它继续再次下载整个维基百科:(

4

4 回答 4

1

尝试

最大镜像深度 = 1(保留此 2,当 1 不起作用时)

最大外部深度 = 0 !! 为我工作

于 2018-06-24T15:09:22.573 回答
1

在这里找到了一个有问题的解决方案:主题:回复:防止下载外部内容

问题是现在外部链接指向一个看起来很丑陋的页面,这是可以修复的。

但是,像 youtube 这样的嵌入内容现在也被这个丑陋的页面所取代 :(

至少它不再下载整个互联网......

于 2016-12-14T12:51:55.680 回答
0

对于 gui 版本。在过滤器中为您不需要的所有下载站点设置例外,它们的名称可以从下载文件夹中复制。例如:

*.png +*.gif +*.jpg +*.jpeg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
+meNeedSite.com/* +forum.mysite.com/*
-meNotNeedSite.com/* -fiu-vro.wikipedia.org/* -fj.wikipedia.org/* -fo.wikipedia.org/* -fonts.googleapis.com/* -fonts.gstatic.com/* -foundation.mozilla.org/* -fr.wikipedia.org/* -frr.wikipedia.org/* -ftp.mozilla.org/* -fur.wikipedia.org/* -fy.wikipedia.org/* -ga.wikipedia.org/* -gd.wikipedia.org/* -gl.wikipedia.org/* -glk.wikipedia.org/* -gmpg.org/* -gn.wikipedia.org/* -ha.wikipedia.org/* -hacks.mozilla.org/* -he.wikipedia.org/* -hi.wikipedia.org/* -hr.wikipedia.org/* -hsb.wikipedia.org/* -hu.wikipedia.org/* -human.spbstu.ru/* -hy.wikipedia.org/* -hyw.wikipedia.org/* -ia.wikipedia.org/* -id.google.com/* -id.wikipedia.org/* -ie.wikipedia.org/* -ilo.wikipedia.org/* -images.ctfassets.net/* -is.wikipedia.org/* -it.wikipedia.org/* -ja.wikipedia.org/* -jv.wikipedia.org/* -ka.wikipedia.org/* -kab.wikipedia.org/* -kk.wikipedia.org/* -kn.wikipedia.org/* -ko.wikipedia.org/* -krc.wikipedia.org/* -ks.wikipedia.org/* -ku.wikipedia.org/* -ky.wikipedia.org/* -la.wikipedia.org/* -labs.mozilla.org/* -lad.wikipedia.org/* -lb.wikipedia.org/* -learning.mozilla.org/* -lez.wikipedia.org/* -lij.wikipedia.org/* -lmo.wikipedia.org/* -ln.wikipedia.org/* -lo.wikipedia.org/* -lt.wikipedia.org/* -lv.wikipedia.org/*
于 2022-01-13T15:05:25.610 回答
0

我会尝试:

-a
    *stay on the same address (--stay-on-same-address)
-d
    stay on the same principal domain (--stay-on-same-domain)
于 2017-07-31T16:56:20.343 回答