我在XML::LibXML::Reader文档中没有找到任何关于解析 HTML 的内容。我试图解析一个 HTML 站点,但它没有用。我的结论是 XML::LibXML::Reader 不适用于 HTML 吗?
问问题
498 次
2 回答
3
除非它真的是 XHTML,否则不会。XML 比 HTML 更严格,而且 XML 解析器通常不能解析 HTML。
HTML::TokeParser(或其基类HTML::PullParser )与XML::LibXML::Reader最相似(但并非完全相似)。
您可能想查看HTML-Tree以了解与 LibXML 类似的东西,它确实适用于 HTML。还有HTML::TreeBuilder::LibXML,它围绕 HTML-Tree 包装了一个更加兼容 LibXML 的接口。
于 2010-04-23T08:17:42.397 回答
1
不,但是HTML::TreeBuilder::LibXML在 HTML 解析器上实现了兼容的接口。
于 2010-04-23T08:22:02.190 回答