python - python xml2dict 复杂的xml

Question

我有一个庞大而复杂的 xml 文档，我想将其解析为字典（然后使用 sqlalchemy 解析为数据库）。我想使用xmltodict来完成这项任务。
但是，xmltodict 似乎无法直接解析深度嵌套的 xml。

我的 MWE：

测试.xml

<?xml version="1.0" encoding="UTF-8"?>
<ns1:tag-1>
    <ns2:tag-2 attrib1="value" attrib2="value">
        <ns3:tag-3 attrib3="value">blabla</ns3:tag-3>
    </ns2:tag-2>
</ns1:tag-1>

测试.py

import xmltodict as x2d
with open('ESCIDOC_test.xml', encoding='utf-8') as purein:
    doc = x2d.parse(purein.read())
print(doc['ns1:tag-1']['ns2:tag-2']['@attrib2'])  # works
print(doc['ns1:tag-1']['ns2:tag-2']['ns3:tag-3']['#text'] # does not work, TypeError
ns3tree = doc['ns1:tag-1']['ns2:tag-2']['ns3:tag-3'] 
print(ns3tree['#text'])  # works

为什么我需要先将它分配给一个新变量才能使其工作？无论如何，整个 xml 都会被解析，不是吗？

print(doc)
# OrderedDict([('ns1:tag-1', OrderedDict([('ns2:tag-2', OrderedDict([('@attrib1', 'value'), ('@attrib2', 'value'), ('ns3:tag-3', OrderedDict([('@attrib3', 'value'), ('#text', 'blabla')]))]))]))])

这是因为可能的内存问题吗？有没有更优雅的解决方法？

score 3 · Accepted Answer

您在不起作用的行上省略了关闭 ) 。

我使用了 python 3.5，复制了您的文件，但添加了结尾）并将 ESCIDOC_test.xml 更改为 test.xml。运行它并且所有 3 个打印语句都正常工作（没有 TypeError）。

python - python xml2dict 复杂的xml

1 回答 1

Related

Reference