使用一个非常基本的 Scrapy 脚本,我想确保我的输出行都不包含空白项。
也就是说,说我有标准
items = []
for list in lists:
item = TypeItem()
item['thing1'] = list.select('h1/text()').extract()
item['thing2'] = list.select('h2/text()').extract()
item['thing3'] = list.select('h3/text()').extract()
items.append(item)
return(items)
我想阻止任何 csv 行显示“thing1,,thing3”或“,thing2”等。
(我是stackoverflow的新手,所以我不知道一次问多个问题是否合适,但由于它们是相关的,如果可以的话:
Q2:如果我在 items.append(item) 之前勾选“如果项目不在项目中”,它会停止任何重复的完整行,还是只是重复单个项目?如果是后者,如何防止重复行?)