python - 使用 Elementree 从 bz2 文件中查找 XML 中的所有标题

问问题 2017-03-14T20:13:15.977

224 次

我是解析 XML 的新手，并且对在 XML 中查找所有标题（标题标签）的代码感到困惑。这就是我想出的，但它只返回一个空列表，而那里应该有标题。

import bz2
from xml.etree import ElementTree as etree

def parse_xml(filename):
    with bz2.BZ2File(filename) as f:
        doc = etree.parse(f)
        titles = doc.findall('.//{http://www.mediawiki.org/xml/export-0.7/}title')

    print titles[:10]

有人能告诉我为什么这不能正常工作吗？只是要清楚; 我需要找到存储在列表中的标题标签内的所有文本，这些文本取自包含在 bz2 文件中的 XML（据我所知，最好的方法是不解压缩）。

python - 使用 Elementree 从 bz2 文件中查找 XML 中的所有标题

0 回答 0

Related

Reference