我们想为某些目的打开一个新域(称为 PR)。问题是我们希望域指向我们目前拥有的同一个网站。
我们根本不希望这个新域出现在搜索引擎(特别是 Google)上。
我们排除的选项:
- 无法使用 Robots.txt - 它在两个域上的工作方式相同,这不是我们想要的。
rel=canonical
不会阻止 - 仅建议将类似页面编入索引。原始页面可能最终被编入索引。
有没有办法处理这个?
编辑
关于.htaccess
建议:我们在 IIS7 上。
我们想为某些目的打开一个新域(称为 PR)。问题是我们希望域指向我们目前拥有的同一个网站。
我们根本不希望这个新域出现在搜索引擎(特别是 Google)上。
我们排除的选项:
rel=canonical
不会阻止 - 仅建议将类似页面编入索引。原始页面可能最终被编入索引。有没有办法处理这个?
编辑
关于.htaccess
建议:我们在 IIS7 上。
rel=canonical
不是建议。它准确地告诉谷歌要使用哪个页面。
话虽如此,当您不想索引域中的页面时,您可以使用`x-robots-tag-阻止这些页面被索引:
只需将任何受支持的 META 标记添加到用于提供文件的 HTTP 标头中的新 X-Robots-Tag 指令。
不要将此文档包含在 Google 搜索结果中:
X-Robots-Tag: noindex
我会通过说站点根目录的相关域上的 .htaccess 文件来阻止。
BrowserMatchNoCase SpammerRobot bad_bot
Order Deny,Allow
Deny from env=bad_bot
您必须指定主要搜索引擎使用的不同机器人。或者您可以允许所有已知的网络浏览器并将它们列入白名单。
您是否尝试过在 Google 网站管理员工具中设置您的首选域?
这种方法的缺点是它不适用于其他搜索引擎。