我 99% 确定我hxs.select
在这个网站上发生了什么事。我无法提取任何东西。当我运行以下代码时,我没有收到任何错误反馈。title
或者link
没有被填充。有什么帮助吗?
def parse(self, response):
self.log("\n\n\n We got data! \n\n\n")
hxs = HtmlXPathSelector(response)
sites = hxs.select('//div[@class=\'footer\']')
items = []
for site in sites:
item = CarrierItem()
item['title'] = site.select('.//a/text()').extract()
item['link'] = site.select('.//a/@href').extract()
items.append(item)
return items
有没有办法可以调试这个?我还尝试使用scrapy shell
带有 url 的命令,但是当我view(response)
在 shell 中输入时,它只是返回True
并打开一个文本文件而不是我的 Web 浏览器。
>>> 响应.url 'https://qvpweb01.ciq.labs.att.com:8080/dis/login.jsp' >>> hxs.select('//div') 回溯(最近一次通话最后): 文件“”,第 1 行,在 AttributeError:“NoneType”对象没有属性“选择” >>> 视图(响应) 真的 >>> hxs.select('//body') 回溯(最近一次通话最后): 文件“”,第 1 行,在 AttributeError:“NoneType”对象没有属性“选择”