我遇到了一个看起来像这样的“XML”片段(缩进和缩写 -...
代表更多标签):
<items>"Std Stability"
<items[1]>
<id>-2</id>
...
</items[1]>
<items[2]>
<id>-5</id>
</items[2]>
...
</items>
这些[1]
数字阻塞了我正在使用的解析器(lxml)。是否有一些类似的格式有效?还是我必须编写一个自定义解析器来处理它?
我对格式没有任何控制权,文档实际上并没有描述或命名格式。