0

此示例 RSS 提要中,可选项目元素pubDate包含在所有条目中。但它不能作为 Python 模块feedparser中的 item 元素使用。这段代码:

import feedparser
rss_object = feedparser.parse("http://cyber.law.harvard.edu/rss/examples/rss2sample.xml")
for entry in rss_object.entries:
    print entry.pubDate

导致错误AttributeError: object has no attribute 'pubDate',但我可以成功地print entry.description看到所有描述标签的内容。

4

1 回答 1

6

feedparser是一个固执己见的解析器,而不是简单地在字典中返回 XML。的文本pubDateentries[i].published.

此条目首次发布的日期,以与原始提要中发布的格式相同的字符串形式。

工作代码:

for entry in rss_object.entries:
    print entry.published

注意:published根据提要的格式,从几个可能的 XML 标记之一中提取。有关列表,请参阅参考手册

本手册还声称 pubDate 元素在entries[i].published_parsed. 里面是published_parsed一个time.struct_time对象;如果原始提要包含时区,您可能需要自己重新解析日期以维护时区信息。

于 2016-01-05T01:52:22.620 回答