我是python和scrapy的新手,因此遇到了一些基本的疑问(请避免我对一些基础知识的无知,我愿意学习:D)。
现在我正在编写一些蜘蛛并在命令行中使用 scrapy-ctl.py 来实现它们,方法是输入:
C:\Python26\dmoz>python scrapy-ctl.py crawl spider
但我不想要两个单独的 python 代码和一个命令行来实现这个。我想以某种方式定义一个蜘蛛,并通过编写和运行一个 python 代码让它抓取 url。我可以注意到在文件 scrapy-ctl.py , 'execute' 类型的函数被导入,但我不知道如何在包含蜘蛛的代码中定义这个函数。如果可能的话,有人可以解释我如何做到这一点,因为它大大减少了工作。
提前致谢!!