我正在使用feedparser来处理 RSS。我定期(例如每 15 分钟)获取带有项目的 RSS 频道并将其存储。在频道中通常没有任何新项目。所以,效率不高。
有没有办法快速检测频道中是否有一些新项目,如果没有,则对该频道不执行任何操作?
谢谢你
我正在使用feedparser来处理 RSS。我定期(例如每 15 分钟)获取带有项目的 RSS 频道并将其存储。在频道中通常没有任何新项目。所以,效率不高。
有没有办法快速检测频道中是否有一些新项目,如果没有,则对该频道不执行任何操作?
谢谢你
对于 RSS 2.0,频道元素有一个可选的 lastBuildDate 元素。对于 atom,有一个类似的“atom:updated”元素,但标准确实指出,这是“条目或提要以发布者认为重要的方式进行修改。因此,并非所有修改都必然导致 atom:updated 更改价值”。
RSS 2.0 中还有一个 PubDate 元素,也是可选的,但 lastBuildDate 应该是要使用的元素,假设它在那里并且发布者正确使用它。
您可以存储前一个并将新检索到的值与旧值进行比较。
在 feedparser 上添加了材料:对于 feedparser,请参阅 feed-updated_parsed 和 feed-updated。