Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
嗨,如何使用损坏的 xml 中存在的 xml 的有效部分
例如:<nodea> <nodeb>DATA</nodeb <nodec> DATA </nodec>
在上面,因为 nodea 没有关闭,所以这是一个损坏的 xml,但 nodeb 和 nodec 是 nodea 中存在的有效 Xml。所以我可以检索其中的数据还是不使用 libxml2。
在解析文件之前,您必须通过启发式破解来修复文件。
$ cat broken.xml <nodea> <nodeb>DATA</nodeb <nodec> DATA </nodec> $ < broken.xml sed 's%</nodeb[^>]%</nodeb>%' <nodea> <nodeb>DATA</nodeb> <nodec> DATA </nodec>