python - 当我使用 python 的 html5lib 时出现“expected-doctype-but-got-chars”错误？

Question

这是我的代码：

from html5lib import treebuilders, HTMLParser
parser = HTMLParser(tree=treebuilders.getTreeBuilder("lxml"))
parser.parse("hello world!")
print parser.errors

是什么导致错误？

但是 html5lib 的文档使用了这个：

import html5lib
parser = html5lib.HTMLParser(tree=html5lib.getTreeBuilder("dom"))
minidom_document = parser.parse("<p>Hello World!")

score 1 · Accepted Answer

HTMLParser.errors包含解析文档的所有解析错误；默认情况下，html5lib 应该优雅地处理所有解析错误（是的，文档确实包含生成解析错误的示例 - 目的是记录 API，而不是显示良好的 HTML 用法！），因此除非您出于某种原因担心解析错误（除非你有充分的理由去做，不要去做），它的价值是完全无关的。

score 0 · Accepted Answer

0

当我使用后代码时，它成功：

parser.parse("<!DOCTYPE html>hello world!")

于 2013-07-09T03:29:23.360 回答

python - 当我使用 python 的 html5lib 时出现“expected-doctype-but-got-chars”错误？

2 回答 2

Related

Reference