0

我是解析 XML 的新手,并且对在 XML 中查找所有标题(标题标签)的代码感到困惑。这就是我想出的,但它只返回一个空列表,而那里应该有标题。

import bz2
from xml.etree import ElementTree as etree

def parse_xml(filename):
    with bz2.BZ2File(filename) as f:
        doc = etree.parse(f)
        titles = doc.findall('.//{http://www.mediawiki.org/xml/export-0.7/}title')

    print titles[:10]

有人能告诉我为什么这不能正常工作吗?只是要清楚; 我需要找到存储在列表中的标题标签内的所有文本,这些文本取自包含在 bz2 文件中的 XML(据我所知,最好的方法是不解压缩)。

4

0 回答 0