3

我的应用程序需要跟踪 RSS/Atom 提要并将新条目保存在数据库中。我的问题是,确定提要中的条目是否已被抓取的最可靠方法是什么?

我使用Universal Feed Parser模块来解析提要。我当前的实现会记录 的最新值feed.entry[i].updated_parsed,当抓取时,如果updated_parsed条目的值大于记录的值,则该条目将保存在数据库中。这里的问题是许多提要没有发布日期或更新日期。

4

1 回答 1

3

您应该确定您是否已经通过主要参考条目(在没有 a 的情况<guid>下回退到)来抓取条目,以及仅作为辅助分析与日期有关的任何事情。<link><guid>

于 2009-03-28T05:25:46.713 回答