8

我有使用 Scrapy 框架编写的蜘蛛。我在让任何管道正常工作时遇到了一些麻烦。我的 pipelines.py 中有以下代码:

class FilePipeline(object):

    def __init__(self):
        self.file = open('items.txt', 'wb')

    def process_item(self, item, spider):
        line = item['title'] + '\n'
        self.file.write(line)
        return item

我的 CrawlSpider 子类有这条线来激活这个类的管道。

ITEM_PIPELINES = [
        'event.pipelines.FilePipeline'
    ]

但是,当我使用它运行它时

scrapy crawl my_spider

我得到一条线,上面写着

2010-11-03 20:24:06+0000 [scrapy] DEBUG: Enabled item pipelines:

没有管道(我认为这是日志记录应该输出它们的地方)。

我尝试过查看文档,但似乎没有任何完整项目的完整示例来查看我是否遗漏了任何内容。

关于下一步尝试什么的任何建议?或在哪里寻找进一步的文件?

4

2 回答 2

8

知道了!该行需要进入项目的设置模块。现在它起作用了!

于 2010-11-04T20:17:59.263 回答
0

我敢打赌,这是管道中某个地方的大小写差异:

管道与管道

我注意到'event.pipelines.FilePipeline'使用前者,而您的代码使用后者:您的文件名使用哪个?

(我已经多次成为这个拼写错误的受害者!)

于 2010-11-03T19:27:47.783 回答