有没有程序爬取指定的网站,如果有引用另一个网站就会吐出来?我有图像、视频文件、pdf 等。我需要给另一个开发人员以完成端口到他们的新服务器。
我刚刚将一个旧网站转移给另一个人,他们仍在使用我的文件。我不知道 100% 是所有文件,我想确定我需要给他们什么文件。如果有一个可以抓取的链接检查器之类的东西会很好,如果有对网站根目录(例如 sub.domain.com)的引用,那么它会吐出有关它的信息(什么页面,什么是 url)。
我现在不想阻止该网站使用这些文件,所以这已经结束了。
我在 Mac 上,所以任何终端程序都可以。