0

嗨,如何使用损坏的 xml 中存在的 xml 的有效部分

例如:<nodea>
<nodeb>DATA</nodeb
<nodec> DATA </nodec>

在上面,因为 nodea 没有关闭,所以这是一个损坏的 xml,但 nodeb 和 nodec 是 nodea 中存在的有效 Xml。所以我可以检索其中的数据还是不使用 libxml2。

4

1 回答 1

0

在解析文件之前,您必须通过启发式破解来修复文件。

$ cat broken.xml 
<nodea>
<nodeb>DATA</nodeb 
<nodec> DATA </nodec>
$ < broken.xml sed 's%</nodeb[^>]%</nodeb>%'
<nodea>
<nodeb>DATA</nodeb>
<nodec> DATA </nodec>
于 2012-04-04T09:48:30.607 回答