Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
当我使用谷歌阅读器时,我发现有时网站不支持 rss,但不知何故谷歌阅读器产生了它,并显示它。我想知道谷歌阅读器是如何做到的。任何编程语言解决方案或只是理论都可以。
我不会假装我知道谷歌阅读是如何做到的,但这里有一个简单的提示:
当浏览器第一次加载页面时,他会在缓存中保留一个副本。下次需要加载页面时,浏览器首先检查页面自上次加载以来是否发生了变化。如果不是,他将简单地加载缓存中的版本,否则,他将再次重新获取页面。
据我所知,这种机制是使用HEAD HTTP 操作和Last-Modified标头完成的。
这应该是您的起点,因为它可以快速找出是否发布了一些新内容。
下一步将使用一些巧妙的算法来定义更改是什么,是否足够相关以被视为新内容以及如何呈现它。
参考