3

我正在构建的应用程序的一部分需要检查 RSS 提要以获取更新。我正在寻找一种可靠的方法来了解提要是否有新条目。

我知道有时人们会发帖到未来,然后再发帖到现在,这可能会导致某些条目被隐藏。似乎还有比这更多的并发症。我还知道,对标题或内容进行散列会导致性能不佳和结果不可靠,因为这些可能会发生变化并且不是新条目的标志。而且我知道几年前当我手动维护播客 RSS 提要时,我从未更改过该项目。

所以,我需要一些方法来可靠地检查 RSS、Atom 等提要中的新条目,因为它们是最后一次检查的。

具体来说,这个应用程序将使用Universal Feed Parser用 Python 为 Google App Engine 编写,但我怀疑在这种情况下这太重要了。

4

2 回答 2

1

您可以通过将 if-modified-since 标头添加到您的 http 请求来使用条件获取。如果没有更改,表现良好的服务器将返回未修改的 304。

于 2009-10-01T05:23:20.830 回答
1

Feed 项具有唯一的 ID 和/或可能是唯一的 url。仅将它们散列在一起以获得快速合理的方法来检测更改。但唯一确定的方法是像你说的那样对内容进行散列。

于 2009-10-01T05:27:34.097 回答