如果 XML 有多个顶级项,我如何使用 Python ElementTree 读取 XML 文件?
我有一个想要使用 Python ElementTree 读取的 XML 文件。
不幸的是,它有多个顶级标签。我会环绕<doc>...</doc>
XML,除了我必须在and字段<doc>
之后放置。但弄清楚终点在哪里并非易事。<?xml>
<!DOCTYPE>
<!DOCTYPE>
我有的:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE FOO BAR "foo.dtd" [
<!ENTITY ...>
<!ENTITY ...>
<!ENTITY ...>
]>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
我想要的是:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE FOO BAR "foo.dtd" [
<!ENTITY ...>
<!ENTITY ...>
<!ENTITY ...>
]>
<DOC>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
<ARTICLE> ... </ARTICLE>
</DOC>
注意标签 ARTICLE 的名称可能会更改,因此我无法对其进行 grep。
任何人都可以向我建议如何<doc>...</doc>
在 XML 标头之后添加封闭,或者建议另一种解决方法?