我最近发现了Scrapy,我觉得它非常有效。但是,我真的不知道如何将它嵌入到用 python 编写的更大的项目中。我想以正常方式创建一个蜘蛛,但能够在给定的 url 上使用函数启动它
start_crawl(url)
这将在给定域上启动爬网过程,并且仅在看到所有页面时才停止。
我最近发现了Scrapy,我觉得它非常有效。但是,我真的不知道如何将它嵌入到用 python 编写的更大的项目中。我想以正常方式创建一个蜘蛛,但能够在给定的 url 上使用函数启动它
start_crawl(url)
这将在给定域上启动爬网过程,并且仅在看到所有页面时才停止。