-1

base_result.htm如果我用 pyquery打开一个 html 文件,它会返回[None],并在我搜索它时抛出错误。如果我使用相同的文件作为字符串,一切正常。

>>> d = PyQuery(filename = 'base_result.html')
>>> d
[None]
>>> f = open('base_result.html')
>>> d = PyQuery(f.read())
>>> d
[<html>] 
4

1 回答 1

1

它是 PyQuery 中的一个未解决问题:https ://github.com/gawel/pyquery/issues/22

上面的链接中提到了一些解决方法,例如:

>>> from lxml.html import parse
>>> parse("index.html")
<lxml.etree._ElementTree object at 0x108a72f38>
>>> pq(parse("index.html").getroot())

或者

>>> f = open('index.html')
>>> d = PyQuery(f.read())
于 2013-08-07T16:43:22.640 回答