5

我正在使用 scrapy 抓取网站,但发生了不好的事情(断电等)。

我想知道我怎样才能从它被打破的地方继续爬行。我不想从种子开始。

4

1 回答 1

5

这可以通过将预定请求持久保存到磁盘来完成。

scrapy crawl somespider -s JOBDIR=crawls/somespider-1

有关更多信息,请参阅http://doc.scrapy.org/en/latest/topics/jobs.html

于 2013-10-01T15:40:33.750 回答