谷歌的网站管理员指南状态
允许搜索机器人在没有会话 ID 或跟踪其在站点中的路径的参数的情况下抓取您的站点。这些技术对于跟踪个人用户行为很有用,但机器人的访问模式完全不同。使用这些技术可能会导致您网站的索引不完整,因为机器人可能无法消除看起来不同但实际上指向同一页面的 URL。
我的 ASP.NET 1.1 站点使用自定义身份验证/授权,并且非常依赖会话 guid(类似于这种方法)。我担心允许非会话跟踪流量会破坏我现有的代码或引入安全漏洞。
允许非会话跟踪机器人爬取正常会话跟踪的站点有哪些最佳实践?除了检查用户代理之外,还有什么方法可以检测搜索机器人(我不希望人们把自己伪装成 googlebot 来绕过我的会话跟踪)?