当我使用 Google 搜索我自己的 Drupal 站点时,我经常在结果中得到页面的打印版本,而不是非打印版本。
任何想法为什么会发生这种情况以及如何防止它?
例如,谷歌以下内容:仅版本 site:community.screen-scraper.com
至少结果的第一页包含指向页面打印版本的链接。URL 的显着特征是“导出”的存在。
我确实启用了干净的 URL。
当我使用 Google 搜索我自己的 Drupal 站点时,我经常在结果中得到页面的打印版本,而不是非打印版本。
任何想法为什么会发生这种情况以及如何防止它?
例如,谷歌以下内容:仅版本 site:community.screen-scraper.com
至少结果的第一页包含指向页面打印版本的链接。URL 的显着特征是“导出”的存在。
我确实启用了干净的 URL。
将 rel=nofollow 添加到您的打印版本的链接中。您还应该考虑设置锥形 url,例如 http://drupal.org/project/nodewords
除了上述内容之外,您还可以向违规页面添加一个 noindex 元标记(通过将元标记注入“打印”页面的标题),并整理出您不希望使用 robots.txt 索引的页面文件。
尝试这些链接以获取更多信息:
(元标记)http://support.google.com/webmasters/bin/answer.py?hl=en&answer=79812
(机器人)http://support.google.com/webmasters/bin/answer.py?hl=en&answer=156449