我正在解析一个 XML 文件,该文件在某些标签之间包含我不想解析的文本,甚至可能有损坏的标签。如何选择不使用用于 Perl 的 xml 解析的可用模块之一来解析该文本?
提前致谢。
如果 XML 被破坏(即格式不正确),您将无法使用 XML 解析器。这是一个特点。所以你需要先修复它。
如果 XML 格式正确,您可以使用XML ::Twigignore_elts
选项。您会看到 XML,就好像被忽略的元素从未存在过一样。
或者,如果 XML “不太损坏”,您可以尝试XML::Liberal,它可能能够处理它。或不...
如果您拥有的是 XHTML、HTML 或类似的东西,您可以使用 XML::LibXML 或 XML::Twig 以及适当的解析方法。
祝你好运...