0

我遇到了一个看起来像这样的“XML”片段(缩进和缩写 -...代表更多标签):

<items>"Std Stability"
  <items[1]>
    <id>-2</id>
    ...
  </items[1]>
  <items[2]>
    <id>-5</id>
  </items[2]>
  ...
</items>

这些[1]数字阻塞了我正在使用的解析器(lxml)。是否有一些类似的格式有效?还是我必须编写一个自定义解析器来处理它?

我对格式没有任何控制权,文档实际上并没有描述或命名格式。

4

1 回答 1

2

这不是一个有效的 Xml 文档,您将无法使用任何符合 Xml 的解析器来处理它。我以前没有见过这样的格式,所以我不知道你会用什么工具来处理这个。我假设他们有一个“自制的”Xml-ish 解析器,您可能希望使用它来读取它。从 Xml 的角度来看 - 在这种情况下,您总是希望将输入固定在源头。想出在您这边解决这样的问题以使其有效的 xml 通常会导致问题。

于 2012-10-15T21:13:16.043 回答