我有以下 XPath,我试图从中提取数据:
/html/body/div[2]/div[2]/div/div/div[4]/ul[2]/li/div
我试图通过 Scrapy Shell 简单地对此进行测试,所以我执行以下操作:
scrapy shell "https://www.rentler.com/listing/520583"
接着:
hxs.select('/html/body/div[2]/div[2]/div/div/div[4]/ul[2]/li/div').extract()
但这会返回[]
。
有任何想法吗?
编辑
我想这样做的全部原因是因为我需要将这 5 个项目分解为单独的变量,而不是一个数组(我目前正在工作):
<ul class="basic-stats">
<li>
<div class="count">4</div>
<div class="label">Bed</div>
</li>
<li>
<div class="count">2</div>
<div class="label">Bath</div>
</li>
<li>
<div class="count">1977</div>
<div class="label">Year</div>
</li>
<li>
<div class="count">1960</div>
<div class="label">SqFt</div>
</li>
<li>
<div class="count">0</div>
<div class="label">Acres</div>
</li>