我有一个大的 xml 文件(大约 84MB),格式如下:
<books>
<book>...</book>
....
<book>...</book>
</books>
我的目标是提取每一本书并获得它的属性。我试图解析它(就像我对其他 xml 文件所做的那样),如下所示:
from xml.dom.minidom import parse, parseString
fd = "myfile.xml"
parser = parse(fd)
## other python code here
但代码似乎在解析指令中失败。为什么会发生这种情况,我该如何解决?
我应该指出,该文件可能包含希腊语、西班牙语和阿拉伯语字符。
这是我在 ipython 中得到的输出:
In [2]: fd = "myfile.xml"
In [3]: parser = parse(fd)
Killed
我想指出计算机在执行过程中冻结,所以这可能与内存消耗有关,如下所述。