7

有没有人知道为什么在 SO 上发布的问题会在 Google 上如此迅速地出现?

有时提交的问题会出现在前 10 个条目左右 - 在提交问题的 30 分钟内出现在首页上。请告诉我,这里正在使用什么样的魔法?

任何人有一些想法,建议?我的第一个想法是他们的站点地图中有信息告诉谷歌机器人每 N 分钟左右拖网一次 - 这是怎么回事?

顺便说一句,我知道如果您没有质量信息(在您的网站上不断更新),那么简单地指示 Googlebots 每 N 分钟扫描一次您的网站是行不通的。

我只是想知道 SO 是否还有其他可能做对的事情(当然除了精彩的内容)

4

4 回答 4

7

简而言之,内容质量更高、变化更频繁的热门网站在谷歌算法下排名更高,并且比不那么受欢迎或变化较少的网站更频繁地被索引和缓存。

于 2010-05-27T12:30:40.767 回答
5

从广义上讲,只有内容才能做到这一点。内容的大小和质量已经达到了谷歌的“网站允许的速度蜘蛛”的门槛。SO 必须主动限制 Googlebot;Jeff 在 Coding Horror 上说过,他们每天从 Google 收到超过 50,000 个请求,而那是一年多以前的事了。

如果您浏览 Alexa 前 500 名中的非新闻网站,您会发现几乎所有这些网站在谷歌中都有几分钟前的结果。(即在 Google 中输入 site:archive.org 并在左侧菜单中选择“最新”)

因此,您可以对自己的网站进行任何实际操作来加速爬虫,除了增加您网站的流量......

于 2010-05-27T12:53:18.233 回答
1

这真的很简单。

SO 是一个为世界提供信息的 PageRank 6 网站。

谷歌对新信息有很强的偏见。它将每天多次抓取该站点,并立即将这些页面添加到其索引中。它会支持一个页面(前 10 个)在一小段时间(几天)内说出一个特定的查询,然后它会停止支持该页面并将其排名为正常。

This is standard G procedure and it happens with many many sites.

As you might guess, grayhat/blackhat seo uses that fact in many ways.

于 2010-06-15T13:25:58.420 回答
0

在 SO 提供 RSS 提要的帮助下,我认为谷歌喜欢来自可靠来源的提要。

于 2010-05-27T12:49:42.833 回答