Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试使用 HTTrack 在此处的 URL 下载搜索请求的结果
不幸的是,下载立即开始并且没有得到搜索结果(因为页面仍然显示一个轮子)。
问题:是否可以在第一个页面请求之后强制暂停,或者在开始之前定义检查(例如页面上的关键字搜索)?
最坏的情况:有没有其他网站复印机可以做到这一点?
非常感谢,汤姆
HTTrack 有很多选项可以配置为允许或禁止抓取网站的某些方面。这篇关于使用 HTTrack 抓取博客的帖子可能会有用。
HTTrack 的一种可能替代方法是使用wget镜像站点。这是使用 wget 创建镜像的演练。