许多 RSS 提要显示的项目数量有限,这意味着当您加载此提要时,它将加载最新的 10 个项目。当使用谷歌阅读器之类的东西时,即使加载时它们不在网站的 RSS 提要中,它也会加载更多内容。即使用户不在网站上,是否也将所有这些提要下载到数据库中?这是如何运作的?
如果它在后台下载提要,那么最好和最有效的方法是什么?我可以想象,如果操作不正确,将这些全部存储在一个表中会变得非常大并且数据密集。
即使用户不在网站上,是否也将所有这些提要下载到数据库中?
是的
这是如何运作的?
通过不将获取数据并填充 Google 数据库的代码与为 UI 输出 HTML 等的代码绑定。
它可以通过简单的 cron 作业或专用守护程序来完成。
如果它在后台下载提要,那么最好和最有效的方法是什么?我可以想象,如果操作不正确,将所有这些存储在一个表中会变得非常大并且数据密集。
有关于该主题的整本书(这使得它不适合 stackoverflow 问题)。
不过,您可能低估了标准 RMDBS 的效率,您不太可能以接近 Google 的规模处理数据,并且 RMDBS 可能会很好地满足您的目的。如果你长大了,那么你长大了,可以看看其他选项(其中有很多,包括分片和 nosql 数据库),但不要过早优化。