我正在尝试按照http://effbot.org/zone/element-iterparse.htm#incremental-parsing中的说明解析大文件(>100mb)
但是如果文件包含命名空间,lxml 会失败并出现错误
lxml.etree.XMLSyntaxError: Namespace default prefix was not found
如果我删除 elem.clear() 效果很好,但会占用大量内存。xml文件示例
<?xml version="1.0" encoding="utf-8" ?>
<feed xmlns="NS">
<offer>
<type>type1</type>
<name>name1</name>
</offer>
</feed>
lxml 版本是 3.2.0,因为新版本在解析结束后会出现段错误