我尝试从用户提供的 URL 开始递归地镜像网页(当然有深度限制)。Wget 没有从 css/js 捕获链接,所以我决定使用httrack。
我尝试镜像一些这样的网站:
# httrack <http://onet.pl> -r6 --ext-depth=6 -O ./a "+*"
该网站使用重定向(301)到http://www.onet.pl:80,httrack 只是下载 index.html 页面:
<a HREF="onet.pl/index.html" >Page has moved</a>
仅此而已!当我运行时:
# httrack <http://www.onet.pl> -r6 --ext-depth=6 -O ./a "+*"
它做我想要的。
有没有办法让 httrack 跟随重定向?目前我只是将“www.”+url添加到 httrack 的 URL 中,但这不是一个真正的解决方案(不涵盖所有用户案例)。有没有更好的 linux 网站镜像工具?