2

我的客户要求我阻止 google bot 索引该网站,因此我将以下元添加到我的主层的 head 标记中,这(理论上)是所有页面的头部:

<meta name="googlebot" content="noindex">

这应该会阻止谷歌索引任何页面,但是,它并没有阻止它。显然,我的客户以某种方式观察到 Google 机器人仍在为该网站编制索引(我不知道他是如何知道 Google 仍在为该网站编制索引的,因为像往常一样,客户的描述性不太强)所以这似乎并不能解决问题.

事实上,我想通过在所有页面使用的模板的标题中添加元数据来防止谷歌索引该网站。为什么这仍然不足以让谷歌阻止它索引该网站?我应该如何解决这个问题?

非常感谢。

4

2 回答 2

4

TL;DR:Google 可能会不小心忽略您添加到网站的元标记。如果您最近添加了元标记,它将在机器人重新抓取网站时跟随它。如果您想摆脱所有搜索机器人,而不仅仅是谷歌使用 <meta name="robots" content="noindex">

这是来自谷歌的官方回答——

“请注意,因为我们必须抓取您的页面才能看到 noindex 元标记,所以 Googlebot 有很小的机会不会看到并尊重 noindex 元标记。如果您的页面仍然出现在结果中,可能是因为我们没有'在您添加标签后未抓取您的网站。(此外,如果您使用 robots.txt 文件阻止此页面,我们也将无法看到该标签。)

如果内容当前在我们的索引中,我们将在下次抓取后将其删除。要加快删除速度,请使用 Google 网站管理员工具中的 URL 删除请求工具。”

此外,请注意您的客户可能会将 Google 机器人与另一个网络爬虫机器人混淆。在这种情况下,我建议添加:

<meta name="robots" content="noindex"> 

到 HTML 文档,以便没有网络爬虫可以索引该站点,而不仅仅是 googlebot。

于 2013-11-30T00:39:30.653 回答
1

我一直这样做<meta name="robots" content="noindex">

您可以查看https://support.google.com/webmasters/answer/93710?hl=enhttps://support.google.com/webmasters/answer/156449?hl=en&ref_topic=2370588了解更多信息。

您的标签可能不起作用的原因是您有一个 robots.txt 文件阻止 Google 重新索引该网站。

于 2013-11-30T00:43:28.670 回答