5

我需要为我正在运行的网站设置一个维护页面,例如在我执行站点维护(计划停机时间)时显示,或者如果确实出现问题并且我需要建立一个保留页面。

我需要做些什么特别的事情来确保搜索引擎爬虫不会将其编入索引并认为它是我的网站。或者我应该做一个 404,添加一个临时 robots.txt 文件还是什么?我基本上不希望他们将它作为我的站点进行索引,但我也不希望他们认为我的站点已经死了并且不会回来。

编辑:这是我在 Apache 中所做的:ErrorDocument 503 /.server-maintenance.html RewriteEngine On RewriteRule !^.server-maintenance.html /server-maintenance Redirect 503 /server-maintenance strong text

4

4 回答 4

10

您应该发送一个503 Service UnavailableHTTP 状态代码,而不是一个404. 将此与Retry-After标题结合使用,以告诉机器人何时返回。

于 2009-04-07T16:26:28.750 回答
3

您可以使用 robots.txt

http://www.robotstxt.org/

此外,谷歌在他们的网站管理员工具中有一个验证器。

https://www.google.com/webmasters/tools/

于 2009-04-07T16:24:10.397 回答
2

Returning503 Service Unavailable告诉 Google 机器人稍后再回来。有一个 Google支持页面描述了 HTTP 错误代码以及它们是如何解释的。

您还可以使用Retry-After 响应标头来建议重新检查站点可用性的最短时间。

于 2009-04-07T16:39:10.280 回答
0

另一种方法是不从您网站(或任何其他网站)上的任何其他页面链接维护页面。

于 2009-04-07T16:28:55.283 回答