我是解析 XML 的新手,并且对在 XML 中查找所有标题(标题标签)的代码感到困惑。这就是我想出的,但它只返回一个空列表,而那里应该有标题。
import bz2
from xml.etree import ElementTree as etree
def parse_xml(filename):
with bz2.BZ2File(filename) as f:
doc = etree.parse(f)
titles = doc.findall('.//{http://www.mediawiki.org/xml/export-0.7/}title')
print titles[:10]
有人能告诉我为什么这不能正常工作吗?只是要清楚; 我需要找到存储在列表中的标题标签内的所有文本,这些文本取自包含在 bz2 文件中的 XML(据我所知,最好的方法是不解压缩)。