python - 使用 feedparser 检索项目的原始 XML

Question

我正在尝试使用 feedparser 从提要中检索一些特定信息，但也检索每个条目的原始 XML（即 RSS 和 Atom 的元素），但我不知道该怎么做。显然我可以手动解析 XML，但这不是很优雅，需要单独支持 RSS 和 Atom，我想它可能会与 feedparser 不同步以获取格式错误的提要。有没有更好的办法？

谢谢！

score 2 · Accepted Answer

我是 feedparser 的当前开发者。目前，获取该信息的一种方法是进行猴子补丁feedparser._FeedParserMixin（或编辑 feedparser.py 的本地副本）。您要修改的方法是：

feedparser._FeedParserMixin.unknown_starttag
feedparser._FeedParserMixin.unknown_endtag

在每个方法的顶部，您可以插入一个回调到您自己的例程，该例程将捕获 feedparser 遇到的元素及其属性。

python - 使用 feedparser 检索项目的原始 XML

1 回答 1

Related

Reference