以下代码采用 XML 并将其转换为字典:
import xml.etree.cElementTree as et
tree = et.parse(path_to_xml)
root = tree.getroot()
xml_dict = etree_to_dict(root)
在哪里:
def etree_to_dict(t):
d = {t.tag: {} if t.attrib else None}
children = list(t)
if children:
dd = defaultdict(list)
for dc in map(etree_to_dict, children):
for k, v in dc.iteritems():
dd[k].append(v)
d = {t.tag: {k:v[0] if len(v) == 1 else v for k, v in dd.iteritems()}}
if t.attrib:
d[t.tag].update(('@' + k, v) for k, v in t.attrib.iteritems())
if t.text:
text = t.text.strip()
if children or t.attrib:
if text:
d[t.tag]['#text'] = text
else:
d[t.tag] = text
return d
但是,上面的函数返回一个无序的字典。我希望它改为返回有序字典。我不清楚如何替换一些字典理解和defaultdict
对此的要求。
输入的一个例子可能是这个:http ://www.w3schools.com/xml/plant_catalog.xml
关于如何更换的任何想法