给定一个网站/博客的 RSS 提要链接,有没有办法在单个 XML 文件中获取该网站的整个 RSS 历史(所有博客帖子)?这是否只有从另一端才有可能(即,一个站点将其整个博客历史发布为 RSS)?在这种情况下,这是如何实现的?
谢谢!小号
给定一个网站/博客的 RSS 提要链接,有没有办法在单个 XML 文件中获取该网站的整个 RSS 历史(所有博客帖子)?这是否只有从另一端才有可能(即,一个站点将其整个博客历史发布为 RSS)?在这种情况下,这是如何实现的?
谢谢!小号
RSS 只是表达数据的另一种方式。这完全取决于网站。如果该站点为您提供了一种方法来指定您想要多少项目(这不太可能),那么您应该知道这在其他站点上不起作用。
从技术上讲,在 RSS 中格式化数据与在 HTML 中格式化没有什么不同。例如,许多站点(包括这个站点)需要在 HTML 页面上表示一些顺序数据(在 SO 的情况下是问题)。为此,该站点将遍历某些数据源(如数据库),并输出 HTML,以便您的 Web 浏览器可以呈现它,直到达到某个限制。知道这个限制是不可能的,因为它取决于站点。这正是 RSS 所做的:它遍历数据源,同时输出 XML。同样,不可能知道极限。
这是只有从另一端才有可能的事情......?在这种情况下,这是如何实现的?
如果您可以更改站点生成 RSS 的方式,只需取消限制即可。我知道这很模糊,但这确实取决于实施。有几十种 RSS 实现,全都不同,而且行为也各不相同。
所以我的观点是,没有什么是通用的,你必须改变网站本身来修改这种行为。
你就在那儿。该站点必须发布其整个历史,否则您将无法获得它。在服务器端执行此操作,如果您可以访问数据库,则非常容易。只需将所有行转储为 XML。过滤和限制xml实际上需要付出努力。您如何在博客平台上做到这一点?您可以使用允许您执行此操作的插件