我正在抓取第一页链接到所有工作的工作网站。现在我从第一页存储标题、工作、公司。
但我也想存储描述,可通过单击职位名称获得。我也想将它与当前项目一起存储。
这是我当前的代码
def parse(self, response):
hxs = HtmlXPathSelector(response)
sites = hxs.select("//div[@class='jobenteries']")
items = []
for site in sites[:3]:
print "Hello"
item = DmozItem()
item['title'] = site.select('a/text()').extract()
item['desc'] = ''
items.append(item)
return items
但是该描述在下一页链接上。我怎样才能做到这一点