我的应用程序需要跟踪 RSS/Atom 提要并将新条目保存在数据库中。我的问题是,确定提要中的条目是否已被抓取的最可靠方法是什么?
我使用Universal Feed Parser模块来解析提要。我当前的实现会记录 的最新值feed.entry[i].updated_parsed
,当抓取时,如果updated_parsed
条目的值大于记录的值,则该条目将保存在数据库中。这里的问题是许多提要没有发布日期或更新日期。
我的应用程序需要跟踪 RSS/Atom 提要并将新条目保存在数据库中。我的问题是,确定提要中的条目是否已被抓取的最可靠方法是什么?
我使用Universal Feed Parser模块来解析提要。我当前的实现会记录 的最新值feed.entry[i].updated_parsed
,当抓取时,如果updated_parsed
条目的值大于记录的值,则该条目将保存在数据库中。这里的问题是许多提要没有发布日期或更新日期。