我正在尝试从该网站http://www.soccerstats.com/latest.asp?league=england抓取目录。我在 python 中使用 scrapy 来获取此表中的详细信息。
<div id="league-table-data" style="text-align:center;clear:both;">
</div>
我尝试了许多 xpath 表达式。首先,我只是想在该表中首先使用团队名称
hxs.select('//div[contains(@id, "league-table")]/div[descendant::td[contains(@align, "left")]]/a/text()').extract()
但是,它返回一个空列表。有什么想法可以让它发挥作用吗?谢谢你。