我想从谷歌缓存中检索一个有数千页的网站。有什么方法可以让我使用 Google Cache 或其他网络爬虫/归档器快速找回它?
问问题
18551 次
2 回答
9
我创建了一项免费服务来恢复您的网站,该服务可以从搜索引擎缓存中检索大多数页面。
该服务的输出是一个压缩文件,其中包含来自搜索引擎缓存的 HTML。它仍处于测试阶段,因此仍需要进行大量调整和错误修复,但希望它可以帮助您或遇到相同问题的其他人。
更新:我没有时间继续开发服务,所以它被关闭了。
于 2012-01-05T14:34:27.273 回答
5
site
您可以通过使用限制来查看 Google(仍然)对网站的了解:
http://www.google.com/search?q=site:[domain]
您还可以查看Internet 档案。
(在任何一种情况下,您都可能想要执行一些重型自动化来获取数千页。)
于 2010-08-07T03:45:28.233 回答