3

我有以下问题。我需要镜像受密码保护的站点。听起来很简单的任务:

wget -m -k -K -E --cookies=on --keep-session-cookies --load-cookies=myCookies.txt http://mysite.com

在 myCookies.txt 中,我保留了正确的会话 cookie。这一直有效,直到 wget 进入注销页面 - 然后会话无效,并且有效地,进一步的镜像是无用的。

W 尝试添加--reject选项,但它仅适用于文件类型 - 我只能阻止 html 文件下载或 swf 文件下载,我不能说

--reject http://mysite.com/*.php?type=Logout*

任何想法如何跳过 wget 中的某些 URL?也许还有其他工具可以完成这项工作(必须在 MS Windows 上工作)。

4

2 回答 2

4

如果您首先下载(甚至只是touch)注销页面,然后

wget --no-clobber --your-original-arguments

这应该跳过注销页面,因为它已经下载

(免责声明:我自己没有尝试过)

于 2012-05-11T09:37:52.373 回答
2

我也遇到过这个问题,后来这样解决了:“--reject-regex logout”,更多:wget-devTips

于 2019-06-26T06:44:02.117 回答