2

html5lib指出它的最新版本 (0.11) 有点旧。使用 Python 部分时,我遇到了问题 70问题 59中所述的递归问题,但找不到稳定的最新 Mercurial 版本。

最新的提示不好,我收到以下错误python setup.py install

byte-compiling build/bdist.linux-x86_64/egg/html5lib/treewalkers/_base.py to _base.pyc
  File "build/bdist.linux-x86_64/egg/html5lib/treewalkers/_base.py", line 40
    "data": []}
         ^
SyntaxError: invalid syntax

我在运行时收到以下错误:

    soup = parser.parse(page.read())
  File "build/bdist.linux-x86_64/egg/html5lib/html5parser.py", line 165, in parse
  File "build/bdist.linux-x86_64/egg/html5lib/html5parser.py", line 144, in _parse
  File "build/bdist.linux-x86_64/egg/html5lib/html5parser.py", line 454, in processDoctype
TypeError: insertDoctype() takes exactly 4 arguments (2 given)

我在带有 lxml 和 BeautifulSoup 的 Python 2.5.2 上使用它。

4

1 回答 1

1

截至 2010 年 1 月,看起来 0.90 版是您想要的:

http://code.google.com/p/html5lib/downloads/list

于 2010-12-06T11:30:53.890 回答