-1

我想在 python 中解析一个 XML 文件并断言一些标签顺序。我已经开始了ElementTree。这是我的代码:

import xml.etree.ElementTree as ET
tree = ET.parse('test.xml')
root = tree.getroot()

这是test.xml

<a>
<b>
for (i=0; i<10; i++){
    k++;
}
</b>
</a>

问题是,解析器卡在for statement了以下错误:

xml.parsers.expat.ExpatError: not well-formed (invalid token): line 3, column 12

我需要解析器忽略标签的主体(忽略任何内容<b></b>)。有没有办法这样做?

提前致谢。

4

1 回答 1

3

您的 XML 标记是无效的 XML 标记!

您需要将有问题的文本包含在 CDATA 部分中。

http://www.w3schools.com/xml/xml_cdata.asp

于 2012-12-17T08:33:28.740 回答