php - 谷歌阅读器如何在后台下载提要？

Question

许多 RSS 提要显示的项目数量有限，这意味着当您加载此提要时，它将加载最新的 10 个项目。当使用谷歌阅读器之类的东西时，即使加载时它们不在网站的 RSS 提要中，它也会加载更多内容。即使用户不在网站上，是否也将所有这些提要下载到数据库中？这是如何运作的？

如果它在后台下载提要，那么最好和最有效的方法是什么？我可以想象，如果操作不正确，将这些全部存储在一个表中会变得非常大并且数据密集。

score 2 · Accepted Answer

即使用户不在网站上，是否也将所有这些提要下载到数据库中？

是的

这是如何运作的？

通过不将获取数据并填充 Google 数据库的代码与为 UI 输出 HTML 等的代码绑定。

它可以通过简单的 cron 作业或专用守护程序来完成。

如果它在后台下载提要，那么最好和最有效的方法是什么？我可以想象，如果操作不正确，将所有这些存储在一个表中会变得非常大并且数据密集。

有关于该主题的整本书（这使得它不适合 stackoverflow 问题）。

不过，您可能低估了标准 RMDBS 的效率，您不太可能以接近 Google 的规模处理数据，并且 RMDBS 可能会很好地满足您的目的。如果你长大了，那么你长大了，可以看看其他选项（其中有很多，包括分片和 nosql 数据库），但不要过早优化。

1 回答 1