在我尝试用scrapy编写蜘蛛时,我试图从元素中提取数据,就像你对href一样,<tr><td><a href = "www.somelink.com">
所以hxs.select('//tr/td/a/@href').extract()
我们在这里做的是获取分配给href的数据
我有一个 span 元素,它有一个类和一个数据属性
<span class="classname" data="{...data in here...}">
但是尝试以下会在scrapy中产生错误,其中我选择了span元素的数据属性,其中span元素类=类名。
hxs.select('//div/span[@class="classname"]/@data/').extract()
是否甚至可以从 href 以外的属性中提取数据,如果可以,我该怎么做?谢谢