0

我刚刚开始使用 python (3.x+) 并试图弄清楚如何从 XML 文件中提取所有元素,包括所有子节点(所以孙子节点和曾孙子节点),而无需在提取每个节点后进行检查孩子。

我无法硬编码,因为 xml 文件可能会更改。我只是想提取元素、它的父元素以及它是否有任何子元素。

4

1 回答 1

0

您是否尝试过使用Feedparser模块并编写一个迭代 for 循环,该循环可以深入到您想要提取的 XML 中的节点?

例如,您可以执行以下操作:

import feedparser
d = feedparser.parse(r'c:\incoming\atom10.xml')  #this is your locally hosted XML file

for index, post in enumerate(d.entries):
    if index >= 5:
        break
    print(post.title) #replace 'title' with the name of the node you want in your XML file, etc 
    print(post.summary)
    print(post.media_keywords)

根据您要在 XML 文件中提取的内容,您必须稍微使用脚本。查看文档以获取更多详细信息。

于 2015-05-09T23:49:50.970 回答