python - Python xmltodict：如何保留 XML 元素顺序？

Question

我正在使用xmltodict进行 XML 解析/反解析，并且我需要在处理一个文档时保留 XML 元素的顺序。玩具 REPL 示例：

>>> import xmltodict
>>> xml = """
... <root>
...   <a />
...   <b />
...   <a />
... </root>
... """
>>> xmltodict.parse(xml)
OrderedDict([('root', OrderedDict([('a', [None, None]), ('b', None)]))])
>>> xmltodict.unparse(_)
'<?xml version="1.0" encoding="utf-8"?>\n<root><a></a><a></a><b></b></root>'

请注意，原始序列[a, b, a]已替换为[a, a, b]。有什么方法可以保留原始订单xmltodict吗？

score 2 · Accepted Answer

它不是超级优雅，但 minidom 可以很好地完成这项工作：

import xml.dom.minidom as minidom

xml = """
<root>
<a />
<b />
<a />
</root>
"""
doc = minidom.parseString(xml)                  # or minidom.parse(filename)
root = doc.getElementsByTagName('root')[0]      # or doc.documentElement
items = [n for n in root.childNodes if n.nodeType == doc.ELEMENT_NODE]

for item in items:
    print item.nodeName

您当然可以使用成熟的 DOM API，例如 lxml，但对于按文档顺序迭代某些节点的适度任务，可能没有必要。

python - Python xmltodict：如何保留 XML 元素顺序？

1 回答 1

Related

Reference