我使用 Python 的内置 XML 解析器来加载 1.5 gig XML 文件,这需要一整天。
from xml.dom import minidom
xmldoc = minidom.parse('events.xml')
我需要知道如何进入其中并衡量其进度,以便显示进度条。有任何想法吗?
minidom 有另一种称为 parseString() 的方法,它返回一个 DOM 树,假设您传递的字符串是有效的 XML,如果我自己将文件拆分成块并一次将它们传递给 parseString,我可以合并所有DOM 树最终会重新组合在一起吗?