0

我正在尝试使用 HTTrack 在此处的 URL 下载搜索请求的结果

不幸的是,下载立即开始并且没有得到搜索结果(因为页面仍然显示一个轮子)。

问题:是否可以在第一个页面请求之后强制暂停,或者在开始之前定义检查(例如页面上的关键字搜索)?

最坏的情况:有没有其他网站复印机可以做到这一点?

非常感谢,汤姆

4

1 回答 1

0

HTTrack 有很多选项可以配置为允许或禁止抓取网站的某些方面。这篇关于使用 HTTrack 抓取博客的帖子可能会有用。

HTTrack 的一种可能替代方法是使用wget镜像站点。是使用 wget 创建镜像的演练。

于 2016-05-03T00:10:21.760 回答