Slashdot 的 RSS 提要是http://rss.slashdot.org/Slashdot/slashdot。如果我直接下载 XML 文件,我只会得到今天的一些帖子。但是,如果我在 Google 阅读器中订阅提要,并在他们的“无限滚动”界面中继续向下滚动,似乎我可以从过去获得任意数量的 Slashdot 帖子——也许我可以得到每一个 Slashdot 帖子?
- Google 阅读器如何从 RSS 提要中检索无限数量的帖子?
- 我该怎么做?
Slashdot 的 RSS 提要是http://rss.slashdot.org/Slashdot/slashdot。如果我直接下载 XML 文件,我只会得到今天的一些帖子。但是,如果我在 Google 阅读器中订阅提要,并在他们的“无限滚动”界面中继续向下滚动,似乎我可以从过去获得任意数量的 Slashdot 帖子——也许我可以得到每一个 Slashdot 帖子?
谷歌为其所有用户跟踪一个提要实例,因此他们一直在跟踪和存储 Slashdot 文章,例如,早在任何新订阅者开始阅读之前。
为此,您必须定期轮询您想要的 RSS 提要并存储您在本地找到的任何独特文章。
我刚刚发现,如果您通过了身份验证,您可以执行以下操作:
http://www.google.com/reader/atom/feed/http://rss.slashdot.org/Slashdot/slashdot?n=100
从提要中获取任意数量的结果。
他们多年来一直在为网络编制索引,并存储他们遇到的所有内容。因此,在您向页面添加“订阅此”链接的那一刻,谷歌爬虫将开始索引该页面并存储它。
对于 RSS,它们还具有让多个人订阅同一个提要的好处。
因此,对于您的应用程序,我建议通过在本地保存任何下载的项目来解决这个问题,以便新订阅可以回到第一个用户订阅该提要的时间点。它不会给你无限的,但随着时间的推移,它会给你一个比仅仅 20 个最新项目更大的存档。
我构建了一个 RSS 存档服务,可以满足您的要求(https://app.pub.center)。所有的 RSS 都可以通过 REST 免费使用。如果您想要推送通知,则必须切换到付费计划。
PubCenter 每天轮询它的 RSS 提要目录,并缓存文章。然后,您可以按时间顺序获取这些文章。例如:
大西洋的第 1 页https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=1
大西洋的第 2 页https://pub.center/feed/02702624d8a4c825dde21af94e9169773454e0c3/articles?limit=10&page=2