在修复网站代码以使用 CDN(将所有 url 重写为图像、js 和 css)之后,我需要测试域上的所有页面以确保从 CDN 获取所有资源。
所有网站页面都可以通过链接访问,没有孤立的页面。
目前我正在使用 FireBug 并检查“网络”视图......
是否有一些自动化的方式来提供域名并请求域的所有页面+资源?
更新:
好的,我发现我可以wget
这样使用:
wget -p --no-cache -e robots=off -m -H -D cdn.domain.com,www.domain.com -o site1.log www.domain.com
选项解释:
-p
- 也可以下载资源(图像、css、js 等)--no-cache
- 获取真实对象,不返回服务器缓存对象-e robots=off
- 无视robots
和no-follow
指示-m
- 镜像站点(点击链接)-H
- 跨主机(也关注其他域)-D cdn.domain.com,www.domain.com
- 指定要关注的女巫域,否则将关注页面中的每个链接-o site1.log
- 记录到文件 site1.log-U "Mozilla/5.0"
- 可选:伪造用户代理 - 如果服务器为不同的浏览器返回不同的数据,则很有用www.domain.com
- 要下载的网站
享受!