我正在尝试在scrapinghub 上运行一个scrapy spider,并且我想传入一些数据。我正在使用他们的 API 来运行蜘蛛:
http://doc.scrapinghub.com/api/jobs.html#jobs-run-json
他们有一个job_settings
似乎相关的选项,但我不知道如何访问job_settings
我Spider
班级中的数据。这里的正确方法是什么?
我正在尝试在scrapinghub 上运行一个scrapy spider,并且我想传入一些数据。我正在使用他们的 API 来运行蜘蛛:
http://doc.scrapinghub.com/api/jobs.html#jobs-run-json
他们有一个job_settings
似乎相关的选项,但我不知道如何访问job_settings
我Spider
班级中的数据。这里的正确方法是什么?
这job_settings
将直接合并到Scrapy 设置中,具有更高的优先级(40
IIRC)。
Scrapy 设置可以通过.settings
蜘蛛实例的属性访问,例如,您可以使用self.settings
if self
is an scrapy.Spider
instance。