当您在服务器上创建带有链接规范文件的 Google 自定义搜索引擎 (CSE) 时,Google 的“FeedFetcher-Google-CoOp”机器人会请求该文件以构建 CSE。似乎即使在结果已返回给用户并且不再使用规范文件之后,谷歌仍会继续定期轮询它至少几天。
我的问题是,在您的 CSE 代码停止请求文件后,Google 将继续轮询文件多长时间,以及是否有任何方法可以强制它立即停止。
(我们创建了一个动态链接的 CSE,它对每个查询都是唯一的,这意味着请求了很多很多规范文件(每次使用不同 GET 参数的相同脚本)。现在我们不再使用它们,FeedFetcher-Google-CoOp 继续用过去的各种参数请求这个脚本。
FeedFetcher-Google-CoOp 会忽略 robots.txt。我们现在返回 410: Gone for all requests,但很难判断这是否有效,因为请求的版本太多(即:/script.php?query=)。理想情况下,无论参数如何,都会有某种方法告诉 Google script.php 不存在,但如果没有 robots.txt,我找不到这样做的方法。
TL;DR: 1) Google 最终会停止自行请求此脚本吗?如果有,什么时候?2)有没有办法立即停止它的请求?