我给谷歌一个包含我所有页面的站点地图,当爬虫试图访问它们时,他会被重定向到登录页面。
在登录页面中,我会解释页面的作用,以便爬虫可以看到每个页面都是不同的。
现在的问题是机器人足够聪明,可以识别出它是一个重定向:
未遵循的 URL 当我们测试您站点地图中的 URL 样本时,我们发现一些 URL 重定向到其他位置。我们建议您的站点地图包含指向最终目的地(重定向目标)的 URL,而不是重定向到另一个 URL。HTTP 错误:302
如果微软没有在 RedirectToLoginPage(String) 中使用重定向,而是使用了 Server.Transfer,谷歌永远不会发现它实际上是同一个页面。
有任何想法吗?