2

在我尝试用scrapy编写蜘蛛时,我试图从元素中提取数据,就像你对href一样,<tr><td><a href = "www.somelink.com">所以hxs.select('//tr/td/a/@href').extract() 我们在这里做的是获取分配给href的数据

我有一个 span 元素,它有一个类和一个数据属性 <span class="classname" data="{...data in here...}">

但是尝试以下会在scrapy中产生错误,其中我选择了span元素的数据属性,其中span元素类=类名。

hxs.select('//div/span[@class="classname"]/@data/').extract()

是否甚至可以从 href 以外的属性中提取数据,如果可以,我该怎么做?谢谢

4

1 回答 1

1

如果您在 之后删除尾部斜杠,它会起作用@data吗?

于 2012-09-24T08:31:34.840 回答