我正在尝试部署我的scrapy crawlers,但问题是我有一个yaml file我试图从内部加载的spider,这在从 shell 加载蜘蛛时有效:scrapy crawl <spider-name>。但是当spider部署在里面时scrapyd,yaml文件的路径必须是absolute.
有没有办法使用 a relative path,yaml file即使蜘蛛被部署了scrapyd?
PS:部署
在:
spiderscrapyd
scrapyd-deploy default -p <project-name>
curl http://127.0.0.1:6800/schedule.json -d project=<project-name> -d spider=<spider-name>
yaml文件加载 :
with open('../categories/categories.yaml', 'r') as f:
pass