我正在制作一个社交网络应用程序,用户将在其中分享 Facebook 等帖子。但是现在我有一些疑问,比如可以说用户只是通过从另一个站点处理内容来共享内容,并且与图像的情况相同。那么谷歌爬虫是否将其视为重复内容?
如果是,那么我如何告诉谷歌爬虫“不要将其视为垃圾邮件,它是一个社交网站,内容由用户而不是我共享”。有什么方法或任何技术可以帮助我。
我正在制作一个社交网络应用程序,用户将在其中分享 Facebook 等帖子。但是现在我有一些疑问,比如可以说用户只是通过从另一个站点处理内容来共享内容,并且与图像的情况相同。那么谷歌爬虫是否将其视为重复内容?
如果是,那么我如何告诉谷歌爬虫“不要将其视为垃圾邮件,它是一个社交网站,内容由用户而不是我共享”。有什么方法或任何技术可以帮助我。
Google 可能会认为它是重复的内容,在这种情况下,搜索算法会选择 1 个版本,它认为它是原始的或更重要的版本,而丢弃另一个。
这本身并不是一件坏事——除非您发现您网站的大部分内容都在重复。
您可以使用规范的 URL 声明来做您所说的,但我不建议这样做。
如果您的网站属于其中一种类型 - 论坛或电子商务,则不会因重复内容问题而受到处罚。我认为“社交平台”是一种论坛。
如果您的页面过于相似,结果是两个或多个相似的页面会分散点击率、流量等,因此 SERP 中的排名可能看起来不太好。
我建议不要使用“规范”,因为这条指令告诉爬虫不要抓取/计算这个页面。如果你使用它,在站长工具中,你会看到被索引的页面减少了很多。
不要太担心重复的内容问题。你可以看到这篇文章:谷歌的马特卡茨:重复的内容不会伤害你,除非它是垃圾邮件