10

我想使用scrapy来获取img的链接,所以我在scrapy的爬虫中编写了下面的程序:

hxs.select('//dl[@class="clearfix"]//img/@src/text()').extract()

但是,它无论如何都不起作用。有什么问题吗 ?

4

2 回答 2

15

如果您使用 CSS 选择器而不是 XPath,则语法为::attr(src)

response.css('.product-list img::attr(src)').extract() # extract_first() to get only one
于 2018-10-07T18:20:29.573 回答
12

text()是元素的文本。只需使用@src

hxs.select('//dl[@class="clearfix"]//img/@src').extract()
于 2013-04-21T03:37:43.860 回答