web-scraping - Scrapy 管理动态蜘蛛

Question

我正在构建一个项目，我需要一个网络爬虫来爬取不同网页的列表。此列表可以随时更改。如何用scrapy最好地实现这一点？我应该为所有网站创建一个蜘蛛还是动态创建蜘蛛？

我已经阅读了有关scrapyd的内容，我想动态创建蜘蛛是最好的方法。我需要一个关于如何实现它的提示。

score 2 · Accepted Answer

如果解析逻辑相同，则有两种方法，

在scrapy中传递参数

    scrapy crawl spider_name -a start_url=your_url

在 scrapyd 中，将 -a 替换为 -d

1 回答 1