base_result.htm
如果我用 pyquery打开一个 html 文件,它会返回[None]
,并在我搜索它时抛出错误。如果我使用相同的文件作为字符串,一切正常。
>>> d = PyQuery(filename = 'base_result.html')
>>> d
[None]
>>> f = open('base_result.html')
>>> d = PyQuery(f.read())
>>> d
[<html>]
base_result.htm
如果我用 pyquery打开一个 html 文件,它会返回[None]
,并在我搜索它时抛出错误。如果我使用相同的文件作为字符串,一切正常。
>>> d = PyQuery(filename = 'base_result.html')
>>> d
[None]
>>> f = open('base_result.html')
>>> d = PyQuery(f.read())
>>> d
[<html>]
它是 PyQuery 中的一个未解决问题:https ://github.com/gawel/pyquery/issues/22
上面的链接中提到了一些解决方法,例如:
>>> from lxml.html import parse
>>> parse("index.html")
<lxml.etree._ElementTree object at 0x108a72f38>
>>> pq(parse("index.html").getroot())
或者
>>> f = open('index.html')
>>> d = PyQuery(f.read())