2

我在 Jetty Web 服务器上使用 JBoss Seam,当查询参数出现在 google 搜索中时,它们会断开链接时遇到一些问题。

第一个参数是 JBoss Seam 用来跟踪对话的 cid 或 conversationId。这是一个小问题,因为谷歌抱怨我正在提交具有相同信息的不同网址。

其次,通过 Google Webmaster API 发布/删除网址而不是通过站点地图发布/删除是否有意义?

沃尔特

4

2 回答 2

4

嘿 Walter,我建议您使用 rel=canonical 标签来告诉搜索引擎忽略 URL 字符串中的某些参数。规范标签是谷歌、雅虎和微软承诺支持的通用标准。

例如,如果 JBoss 创建如下所示的 URL:mysite.com?cid=FOO&conversationId=BAR,那么您可以在您网站的部分中创建一个规范标签,如下所示:

<html>
   <head>
      <link rel="canonical" href="http://mysite.com" />
   </head>
</html>

搜索引擎将使用此信息将您网站上的 URL 标准化为规范(或最短和最权威)版本。具体来说,他们会将其视为从 HTTP 请求的 URL 到规范标记中指定的 URL 的 301 重定向(只要您没有做任何愚蠢的事情,例如使其成为无限循环,或指向一个不存在)。

虽然规范标签非常酷,但它只是一个 90% 的解决方案,因为您仍然可能在网站上使用所有额外参数进行指标跟踪时遇到问题。最好的解决方案是更新您的基础架构以捕获这些跟踪参数,创建一个 cookie,然后使用 301 重定向将 URL 重定向到规范版本。然而,对于额外的 10% 增益来说,这可能是一项令人望而却步的工作,因此许多人更喜欢从规范标签开始。

至于你的第二个问题,如果人们链接到它们,通常你不想从谷歌中删除这些 URL。通过使用规范标签,您可以实现相同的目标,但不会丢失您网站的入站链接的任何价值。

有关规范标签以及具体问题和解决方案的更多信息,请查看我在此处写的这篇文章:http: //janeandrobot.com/library/url-referrer-tracking

于 2009-12-01T08:05:53.770 回答
1

Google 网站管理员工具会告诉您有关重复标题和 Google 看到的其他问题,这些问题是由“重复”引起的,这些“重复”实际上是使用两个不同 URL 版本提供的同一页面。我建议尝试确保网站管理员工具帐户中重复标题下列出的错误数量尽可能接近于零。

于 2012-02-17T19:13:50.233 回答