1

当我使用谷歌阅读器时,我发现有时网站不支持 rss,但不知何故谷歌阅读器产生了它,并显示它。我想知道谷歌阅读器是如何做到的。任何编程语言解决方案或只是理论都可以。

4

1 回答 1

0

我不会假装我知道谷歌阅读是如何做到的,但这里有一个简单的提示:

当浏览器第一次加载页面时,他会在缓存中保留一个副本。下次需要加载页面时,浏览器首先检查页面自上次加载以来是否发生了变化。如果不是,他将简单地加载缓存中的版本,否则,他将再次重新获取页面。

据我所知,这种机制是使用HEAD HTTP 操作和Last-Modified标头完成的。

这应该是您的起点,因为它可以快速找出是否发布了一些新内容。

下一步将使用一些巧妙的算法来定义更改是什么,是否足够相关以被视为新内容以及如何呈现它。

参考

于 2013-06-03T11:26:17.980 回答