我正在使用Scrapy
爬网网站。我需要抓取的链接是http://www.somesite.com/details.html?pageId=<some_integer_id>
. some_integer_id
extends from 1
to的值100
(不完全是 100)。我要做的是:
1.我创建一个函数来生成一个url列表:
def generateURLs(self):
url_list = []
for i in range(1, 101):
url_list.append('http://www.somesite.com/details.html?pageId=%d' % i)
return url_list
2.使用此功能设置的值是start_urls
这样的Scrapy
:
def __init__(self):
self.start_urls = self.generateURLs()
当我只需要更改请求参数的值时,这是推荐的使用方法Scrapy
还是有其他更好的方法可以做到这一点?
谢谢。