1

我有一点情况要来了。由于一个完整的网站结构重新设计基本上是不可能的,我希望我们的站点地图大约 12,000 个 url 有大约 90-95% 的变化。在这 12,000 个中,我预计大约有 5000-6000 个内部链接会在此过程中失效。由于该站点仍在开发中,因此尚无指向该站点的外部链接。

有没有一种工具可以在重组后提供 sitemap.xml 并让它解析每个页面的 404 错误,并且只报告页面/错误?

我找到了一些工具,但似乎都限制在 100 页以内。

对中级网站管理员有什么建议可以帮助解决这种情况吗?在这种情况下,301 重定向是不可行的。

4

1 回答 1

1

根据您在编程方面的经验,这样做应该不难(解析 sitemap.xml,查找所有链接,向每个链接发出 http 请求,保存状态代码)。

如果您正在寻找专门的工具,我会说您可以尝试 wget(向其提供站点地图 URL,请参阅此处了解详细信息:http ://www.wezm.net/technical/2009/05/spider-a-site- with-wget-using-sitemap-xml/ ), 或HTTrack

于 2012-08-22T17:58:46.950 回答