5

HTTrack 提供过滤选项,但我无法弄清楚如何下载某个子文件夹级别并忽略所有其他子文件夹。

例子:

domain.com/
domain.com/pets/
domain.com/pets/elephant
domain.com/zoo/tiger
domain.com/pics/giraffe
domain.com/pics/giraffe/details

我只想下载子文件夹elephanttigergiraffe作为 HTML 包括从那里链接的图像。

HTTrack 有那么强大吗?(我使用的是 Windows GUI 版本“WinHTTrack”。)


PS:将其作为程序选项会很好,例如“最小镜像深度”。

4

1 回答 1

4

我找到了一种方法:

-*
-domain.com/*[path]/*
-domain.com/*[path]
+domain.com/*[path]/*[path]/*
-domain.com/*/specialfolder*
+domain.com/*specialimages*.jpg
-mime:*/* +mime:text/html +mime:image/*

唯一的问题:要获取所有 URL,仅指定根域还不够,还要指定第一级子文件夹(例如:domain.com/pets、domain.com/zoo、domain.com/pics)。

于 2016-03-27T15:19:33.467 回答