0

我想知道谷歌是如何捕捉谷歌即时预览中的所有网站的?我确定他们没有使用缩略图服务(如 www.thumbalizr.com、websnapr.com、snapcasa.com、thumbshots.com),而是使用他们自己的软件。但是:鉴于谷歌捕获了很多网站,他们必须有一个非常复杂的系统。另外:这会产生大量数据(jpgs?)。有人对谷歌如何做到这一点有更深入的了解吗?

4

2 回答 2

1

是的,就是这样。他们的网站管理员页面暗示他们使用 Chrome 使用的相同引擎呈现页面,并且预览基于结果。

于 2012-01-26T22:13:12.800 回答
0

很难说,但这里有一些来自谷歌项目经理的信息讨论:

http://googleblog.blogspot.com/2010/11/beyond-instant-results-instant-previews.html

它部分说:

“我们将您的查询与整个网络的索引相匹配,识别每个网页的相关部分,将它们拼接在一起,并提供完全根据您的搜索定制的结果预览——通常在十分之一秒内”

再加上查看预览页面的来源表明他们正在使用自己的索引(用于提供缓存页面的相同 webcache.googleusercontent.com)来提供 JPEG Base64 图像字符串作为屏幕截图。

于 2011-09-26T19:57:43.560 回答