我正在检查 Google 搜索结果:“site:mywordpress.org”。并找到不应该存在的索引的地段或页面。
这里有两个问题:
我不知道 Google 是如何定位、抓取或找到这些网址的。
Wordpress 没有显示 404 错误,因此看起来像是重复的内容。
我尝试了 Wordpress 支持论坛,但没有人回应。我也找不到任何人报告这个问题。这是我所看到的示例:
mywordpress.org/blog-post/
mywordpress.org/blog-post/1363035032000/
我已经为头部添加了一个规范链接引用,并且我一直在做很多谷歌 WMT 删除请求,但我仍然看到一些这样的结果。
我已经在几个 wordpress 安装中对此进行了测试,似乎如果您在永久链接的末尾添加任何数字字符串,它仍然会显示内容而不是显示 404 错误。
我还注意到添加到永久链接的数字是 UNIX 时间戳,末尾有几个零。在这篇文章中,当前的 UNIX 时间戳为:1363035971。
我正在寻找一些关于我应该做什么的建议。我对一个 PHP 函数特别感兴趣,它会检查 url 以查看末尾是否有一串数字,如果有,301 将其重定向到正确的永久链接。我还重视关于为什么 Google 会发现这些错误的 url 以及 UNIX 时间戳是否是线索的任何输入。