我正在构建的应用程序的一部分需要检查 RSS 提要以获取更新。我正在寻找一种可靠的方法来了解提要是否有新条目。
我知道有时人们会发帖到未来,然后再发帖到现在,这可能会导致某些条目被隐藏。似乎还有比这更多的并发症。我还知道,对标题或内容进行散列会导致性能不佳和结果不可靠,因为这些可能会发生变化并且不是新条目的标志。而且我知道几年前当我手动维护播客 RSS 提要时,我从未更改过该项目。
所以,我需要一些方法来可靠地检查 RSS、Atom 等提要中的新条目,因为它们是最后一次检查的。
具体来说,这个应用程序将使用Universal Feed Parser用 Python 为 Google App Engine 编写,但我怀疑在这种情况下这太重要了。