-1

我正在解析一个 XML 文件,该文件在某些​​标签之间包含我不想解析的文本,甚至可能有损坏的标签。如何选择不使用用于 Perl 的 xml 解析的可用模块之一来解析该文本?

提前致谢。

4

1 回答 1

4

如果 XML 被破坏(即格式不正确),您将无法使用 XML 解析器。这是一个特点。所以你需要先修复它。

如果 XML 格式正确,您可以使用XML ::Twigignore_elts选项。您会看到 XML,就好像被忽略的元素从未存在过一样。

或者,如果 XML “不太损坏”,您可以尝试XML::Liberal,它可能能够处理它。或不...

如果您拥有的是 XHTML、HTML 或类似的东西,您可以使用 XML::LibXML 或 XML::Twig 以及适当的解析方法。

祝你好运...

于 2013-07-31T09:21:02.127 回答