12

我正在运行 python 2.7.2 我安装了 lxml 和 cssselect

我的代码是

from lxml import etree, html
r = html.parse(start_url)
all_titles = r.cssselect('span.titles') #should return a list of results
all_urls = r.cssselect('span.links') #and this as well

我正在抓取一个包含标题及其相关链接的网页。

但我遇到了这个错误:'lxml.etree._ElementTree' 对象没有属性'cssselect'

4

1 回答 1

17

ElementTree没有cssselect方法,而HtmlElement对象有它。

用于ElementTree.getroot获取HtmlElement对象:

r = html.parse(start_url).getroot()
于 2013-11-01T16:03:21.530 回答