0

如果我进入scrapy shell

scrapy shell http://www.tripadvisor.com/Hotels-g60956-San_Antonio_Texas-Hotels.html

并打电话

hxs.select('//title/text()').extract

我明白了

data=u'San Antonio Hotels: Compare 345 Hotels i'

这是 40 个字符,计算空格。这是一个超出 Scrapy 的限制吗,我应该在未来的 unicode 交易中注意这一点吗?

4

2 回答 2

2

你必须将提取函数括起来

hxs.select('//title/text()').extract()

现在您将能够获得全文

于 2013-08-24T20:25:58.600 回答
1
hxs.select("//title/text()").extract()

将返回完整的字符串

在不使用 () 的情况下使用它可能会返回对象的表示形式,该表示形式被限制(用于检查)为 40 个字符。

于 2013-08-24T19:40:43.303 回答