1

我在XML::LibXML::Reader文档中没有找到任何关于解析 HTML 的内容。我试图解析一个 HTML 站点,但它没有用。我的结论是 XML::LibXML::Reader 不适用于 HTML 吗?

4

2 回答 2

3

除非它真的是 XHTML,否则不会。XML 比 HTML 更严格,而且 XML 解析器通常不能解析 HTML。

HTML::TokeParser(或其基类HTML::PullParser )与XML::LibXML::Reader最相似(但并非完全相似)。

您可能想查看HTML-Tree以了解与 LibXML 类似的东西,它确实适用于 HTML。还有HTML::TreeBuilder::LibXML,它围绕 HTML-Tree 包装了一个更加兼容 LibXML 的接口。

于 2010-04-23T08:17:42.397 回答
1

不,但是HTML::TreeBuilder::LibXML在 HTML 解析器上实现了兼容的接口。

于 2010-04-23T08:22:02.190 回答