2

我正在尝试使用 feedparser 从提要中检索一些特定信息,但也检索每个条目的原始 XML(即 RSS 和 Atom 的元素),但我不知道该怎么做。显然我可以手动解析 XML,但这不是很优雅,需要单独支持 RSS 和 Atom,我想它可能会与 feedparser 不同步以获取格式错误的提要。有没有更好的办法?

谢谢!

4

1 回答 1

2

我是 feedparser 的当前开发者。目前,获取该信息的一种方法是进行猴子补丁feedparser._FeedParserMixin(或编辑 feedparser.py 的本地副本)。您要修改的方法是:

  • feedparser._FeedParserMixin.unknown_starttag
  • feedparser._FeedParserMixin.unknown_endtag

在每个方法的顶部,您可以插入一个回调到您自己的例程,该例程将捕获 feedparser 遇到的元素及其属性。

于 2011-11-05T15:27:55.757 回答