0

这是我的代码:

from html5lib import treebuilders, HTMLParser
parser = HTMLParser(tree=treebuilders.getTreeBuilder("lxml"))
parser.parse("hello world!")
print parser.errors

是什么导致错误?

但是 html5lib 的文档使用了这个:

import html5lib
parser = html5lib.HTMLParser(tree=html5lib.getTreeBuilder("dom"))
minidom_document = parser.parse("<p>Hello World!")
4

2 回答 2

1

HTMLParser.errors包含解析文档的所有解析错误;默认情况下,html5lib 应该优雅地处理所有解析错误(是的,文档确实包含生成解析错误的示例 - 目的是记录 API,而不是显示良好的 HTML 用法!),因此除非您出于某种原因担心解析错误(除非你有充分的理由去做,不要去做),它的价值是完全无关的。

于 2013-08-04T15:34:19.843 回答
0

当我使用后代码时,它成功:

parser.parse("<!DOCTYPE html>hello world!")
于 2013-07-09T03:29:23.360 回答