我创建了一个新网站,我不希望它被搜索引擎抓取,也不想出现在搜索结果中。
我已经创建了 robots.txt
User-agent: *
Disallow: /
我有一个 html 页面。我想用
<meta name="robots" content="noindex">
但谷歌页面说它应该在页面未被 robots.txt 阻止时使用,因为 robots.txt 根本看不到 noindex 标签。
有什么方法可以同时使用 noindex 和 robots.txt 吗?
我创建了一个新网站,我不希望它被搜索引擎抓取,也不想出现在搜索结果中。
我已经创建了 robots.txt
User-agent: *
Disallow: /
我有一个 html 页面。我想用
<meta name="robots" content="noindex">
但谷歌页面说它应该在页面未被 robots.txt 阻止时使用,因为 robots.txt 根本看不到 noindex 标签。
有什么方法可以同时使用 noindex 和 robots.txt 吗?
有两种解决方案,都不是优雅的。
你是对的,即使你Disallow: /
的 URL 可能仍然出现在搜索结果中,只是可能没有元描述和谷歌生成的标题。
假设您只是暂时这样做,推荐的方法是在您的网站前进行基本的 http auth。这不是很好,因为用户必须输入基本的用户名和密码,但这会阻止您的网站被抓取和索引。
如果您不能或不想将基本身份验证放在您的网站前面,另一种方法是仍然Disallow: /
在您的 Robots.txt 文件中,并使用 Google Search Console 通过请求删除该网站来定期清除 Google 索引索引。
这在很多方面都是不雅的。