11

是否可以对 Google 的指令进行微调,使其忽略页面的一部分,但仍将其余部分编入索引?

我们遇到了几个不同的问题,这会有所帮助,例如:

  • 显示来自外部来源的内容的页面上的 RSS 提要/新闻自动收录器类型的文本
  • 用户输入联系电话等详细信息,希望他们在网站上可见,但希望他们不能被谷歌搜索

我知道上述两种方法都可以通过其他技术(例如使用 JavaScript 编写内容)来解决,但我想知道是否有人知道 Google 是否已经提供了更简洁的选项?

我一直在对此进行一些研究,发现提到了googleongoogleofftags,但这些似乎是 Google Search Appliances 独有的。

有谁知道 Googlebot 是否会遵守一组类似的标签?

编辑:澄清一下,我不想走危险的路线,向谷歌隐藏/提供不同的内容,这就是为什么我想看看是否有一种“合法”的方式来实现我想要的在这里做。

4

8 回答 8

10

您要求的内容实际上无法完成,Google 要么获取整个页面,要么不获取。

你可以做一些鬼鬼祟祟的技巧,比如在 iFrame 中插入你不想索引的页面部分,并使用 robots.txt 要求 Google 不要索引该 iFrame。

于 2009-09-30T11:17:25.030 回答
1

简而言之,不 - 除非你使用伪装,否则谷歌不鼓励。

于 2009-09-30T11:08:08.310 回答
1

请从这里查看官方文档

http://code.google.com/apis/searchappliance/documentation/46/admin_crawl/Preparing.html

转到“从索引中排除不需要的文本”部分

<!--googleoff: index-->
here will be skipped
<!--googleon: index-->
于 2011-12-23T12:35:52.920 回答
0

找到了使用某些重复内容的有用资源,并且不允许搜索引擎对此类内容进行索引。

<p>This is normal (X)HTML content that will be indexed by Google.</p>

<!--googleoff: index-->

<p>This (X)HTML content will NOT be indexed by Google.</p>

<!--googleon: index>
于 2017-02-12T18:45:06.720 回答
-1

在您的服务器上使用 PHP 或 ASP 通过 IP 检测搜索机器人。然后向该列表中的 IP 地址提供您希望被索引的页面版本。在您的页面的搜索引擎友好版本中,使用规范链接标签向搜索引擎指定您不希望被索引的页面版本。

这样,包含确实要编入索引的内容的页面将仅按地址编入索引,而您希望编入索引的唯一内容将被编入索引。这种方法不会让你被搜索引擎屏蔽,而且是完全安全的。

于 2009-09-30T11:16:56.840 回答
-1

是的,您绝对可以通过创建自定义 robots.txt 来阻止 Google 为您网站的某些部分编制索引,并写下您不想索引的部分,例如 wpadmins 或特定的帖子或页面,这样您就可以通过创建此机器人轻松做到这一点。 txt 文件。在创建之前检查您的站点 robots.txt,例如 www.yoursite.com/robots.txt。

于 2014-01-31T06:45:06.290 回答
-2

有机器人的元标记,还有 robots.txt,您可以使用它来限制对某些目录的访问。

于 2009-09-30T11:08:53.940 回答
-2

所有搜索引擎要么索引要么忽略整个页面。实现您想要的唯一可能的方法是:

(a) 同一页面有两个不同版本

(b) 检测使用的浏览器

(c) 如果它是搜索引擎,则提供页面的第二个版本。

此链接可能会有所帮助。

于 2009-09-30T11:09:55.297 回答