警告:这尚未在野外进行测试,但应该基于我对 Google Webmaster Central 博客和 schema.org 文档的阅读。反正...
这似乎是使用microdata构建内容的一个很好的用例。这涉及将您的内容标记为Article类型的Rich Snippet,如下所示:
<div itemscope itemtype="http://schema.org/Article" class="item first">
<h3 itemprop="name">August 13's correlation</h3>
<p itemprop="description" class="stat">In general, 27 percent of people have never had any wisdom teeth extracted. But among those who describe themselves as pessimists, 38 percent haven't had wisdom teeth extracted.</p>
<p class="info">Based on a survey of 222 people who haven't had wisdom teeth extracted and 576 people in general.</p>
<p class="social"><a itemprop="url" href="http://www.correlated.org/153">Link to this statistic</a></p>
</div>
注意使用itemscope、itemtype和itemprop来定义页面上的每篇文章。
现在,根据谷歌、雅虎和必应支持的schema.org,搜索引擎应该尊重itemprop="url"
上面描述的规范 url:
规范参考
通常,链接是使用元素指定的。例如,以下 HTML 链接到《麦田里的守望者》一书的 Wikipedia 页面。
<div itemscope itemtype="http://schema.org/Book">
<span itemprop="name">The Catcher in the Rye</span>—
by <span itemprop="author">J.D. Salinger</a>
Here is the book's <a itemprop="url"
href="http://en.wikipedia.org/wiki/The_Catcher_in_the_Rye">维基百科页面。
因此,当以这种方式进行标记时,Google 应该能够正确地确定哪条内容属于哪个规范 URL,并相应地在 SERP 中对其进行加权。
完成对内容的标记后,您可以使用Rich Snippets 测试工具对其进行测试,在您将其投入生产之前,它应该可以让您很好地了解 Google 对您的网页的哪些内容。
ps为避免重复内容处罚,您可以做的最重要的事情是修复永久链接页面上的标题。目前他们都阅读“相关 - 发现令人惊讶的相关性”,这将导致您的排名受到巨大冲击。