我刚刚开始使用 python (3.x+) 并试图弄清楚如何从 XML 文件中提取所有元素,包括所有子节点(所以孙子节点和曾孙子节点),而无需在提取每个节点后进行检查孩子。
我无法硬编码,因为 xml 文件可能会更改。我只是想提取元素、它的父元素以及它是否有任何子元素。
我刚刚开始使用 python (3.x+) 并试图弄清楚如何从 XML 文件中提取所有元素,包括所有子节点(所以孙子节点和曾孙子节点),而无需在提取每个节点后进行检查孩子。
我无法硬编码,因为 xml 文件可能会更改。我只是想提取元素、它的父元素以及它是否有任何子元素。
您是否尝试过使用Feedparser模块并编写一个迭代 for 循环,该循环可以深入到您想要提取的 XML 中的节点?
例如,您可以执行以下操作:
import feedparser
d = feedparser.parse(r'c:\incoming\atom10.xml') #this is your locally hosted XML file
for index, post in enumerate(d.entries):
if index >= 5:
break
print(post.title) #replace 'title' with the name of the node you want in your XML file, etc
print(post.summary)
print(post.media_keywords)
根据您要在 XML 文件中提取的内容,您必须稍微使用脚本。查看文档以获取更多详细信息。