我有一个巨大的 XML 文件。但是,我只对这棵大树的一个小子树感兴趣。我想解析这个子树,但我不想浪费时间解析整个巨大的树,因为我只打算使用它的一小部分。
理想情况下,我想扫描文件直到找到这个子树的开头,解析子树直到我到达它的结尾,然后甚至不费心阅读文件的其余部分。甚至可以用 XPath 表达式描述我感兴趣的子树。有没有办法使用lxml做到这一点?看起来您可以使用该iterparse()
方法执行类似的操作,但根据文档,它看起来不会生成我想要使用的已解析对象。有什么建议么?
(不需要使用 lxml,但我想使用 Python,理想情况下我希望它很快。)