2

我不明白为什么scrapy 在http://www.alize.gen.tr/index.php?is=urun_detay&id=37页面上看不到一些 //div/text() 。例如:

scrapy view http://www.alize.gen.tr/index.php?is=urun_detay&id=37

scrapy shell http://www.alize.gen.tr/index.php?is=urun_detay&id=37

>>> hxs.select("//td[@class='urun_adi']/div/text()").extract()

返回 [u'\r\n'] 但必须是 [u'\r\nANGORA GOLD']

我哪里错了?

4

1 回答 1

1

为我工作:

stav@maia:~$ scrapy shell "http://www.alize.gen.tr/index.php?is=urun_detay&id=37"
2013-03-28 20:36:39-0600 [scrapy] INFO: Scrapy 0.17.0 started (bot: scrapybot)
...
>>> hxs.select("//td[@class='urun_adi']/div/text()").extract()
[u'\r\nANGORA GOLD']

你用的是什么版本的 Scrapy?

stav@maia:~$ scrapy version -v
Scrapy  : 0.17.0
lxml    : 2.3.2.0
libxml2 : 2.7.8
Twisted : 11.1.0
Python  : 2.7.3 (default, Aug  1 2012, 05:14:39) - [GCC 4.6.3]
Platform: Linux-3.2.0-39-generic-x86_64-with-Ubuntu-12.04-precise
于 2013-03-29T02:39:04.347 回答