我最近开始使用 Scrapy。我正在尝试从一个大列表中收集一些信息,该列表分为几页(大约 50 页)。我可以轻松地从第一页中提取我想要的内容,包括start_urls
列表中的第一页。但是,我不想将这 50 个页面的所有链接都添加到此列表中。我需要一种更动态的方式。有谁知道我如何迭代地抓取网页?有没有人有这方面的例子?
谢谢!
我最近开始使用 Scrapy。我正在尝试从一个大列表中收集一些信息,该列表分为几页(大约 50 页)。我可以轻松地从第一页中提取我想要的内容,包括start_urls
列表中的第一页。但是,我不想将这 50 个页面的所有链接都添加到此列表中。我需要一种更动态的方式。有谁知道我如何迭代地抓取网页?有没有人有这方面的例子?
谢谢!