我正在使用scrapy从网页中抓取信息。我已经编写了运行良好的蜘蛛代码。我还有一些其他 python 代码文件可以优化爬取的数据。
总而言之,我有一个批处理文件,我首先在其中使用“Scrapy Crawl”命令,然后运行我的 python 文件来优化抓取的信息。
问题是批处理脚本在“Scrapy Crawl”命令的末尾停止,并且不会继续执行我的批处理文件中的行。我怎么解决这个问题?
批处理文件的内容:
CD "spiders_folder"
scrapy crawl mySpider -o outputData.json -t json
python refineData.py