xpath - 如何从元素内的属性中提取数据

Question

在我尝试用scrapy编写蜘蛛时，我试图从元素中提取数据，就像你对href一样，<tr><td><a href = "www.somelink.com">所以hxs.select('//tr/td/a/@href').extract() 我们在这里做的是获取分配给href的数据

我有一个 span 元素，它有一个类和一个数据属性 <span class="classname" data="{...data in here...}">

但是尝试以下会在scrapy中产生错误，其中我选择了span元素的数据属性，其中span元素类=类名。

hxs.select('//div/span[@class="classname"]/@data/').extract()

是否甚至可以从 href 以外的属性中提取数据，如果可以，我该怎么做？谢谢

score 1 · Accepted Answer

1

如果您在之后删除尾部斜杠，它会起作用@data吗？

于 2012-09-24T08:31:34.840 回答

1 回答 1