1

我在用scrapy 0.14

下面是我的代码

start_urls = ['http://lakebagger.com/ur/']

def parse(self, response):
    hxs = HtmlXPathSelector(response)
    stores=hxs.select('//table[@id]//tr')
    print len(stores)

我无法访问tbody中的行(tr) ,而不是我只能访问thead行。我如何访问行?

提前致谢 。看起来 HtmlXpathSelector 无法准确地排序 xpath

4

1 回答 1

2

在这一点上,我会说它是环境问题,尽管不是操作系统问题,因为我设法让一个类似的脚本在 Windows 7 上运行。键入“pip freeze”的结果是什么?

矿:

Scrapy==0.16.2
Twisted==12.2.0
distribute==0.6.32
egenix-pyopenssl==0.13.0-1.0.0g-1
lxml==3.0.1
pyOpenSSL==0.9
pywin32==216
w3lib==1.2
zope.interface==3.8.0

另外,我确实认为您应该发布完整的蜘蛛代码以供检查,因为缺少的行中可能存在导致问题的内容。

编辑:根据您的评论,这可能与您运行 0.14 的版本有关。有没有考虑升级?

注意:我按照这些步骤安装了scrapy。

于 2012-12-10T08:30:36.163 回答