3

我正在根据 docinfo 有条件地针对多个 DTD 解析和验证相当大的 XML(>100MB):

parser = etree.XMLParser(recover=True)
xmlfile = etree.parse(file,parser)
if "aaa.dtd" in xmlfile.docinfo.doctype.lower():
    dtdfile= "dtds/aaa.dtd"
elif "bbb.dtd" in xmlfile.docinfo.doctype.lower():
    dtdfile= "dtds/bbb.dtd"
elif "ccc.dtd" in xmlfile.docinfo.doctype.lower():
    dtdfile= "dtds/ccc.dtd"
dtd = etree.DTD(dtdfile)
if dtd.validate(xmlfile)==True:
    do sth

我的问题是内存消耗,所以我想我应该改用 iterparse 但我找不到一种方法来做同样的验证。

提前致谢。

4

0 回答 0