1

我正在学习 Python,并在 scrapy 中编写了一个小爬虫。目前,我正在使用硬编码的 url 数组列表,如下所示:

"http city1 /%(searchterm)s"dict(searchterm=searchterm),
"http city2 /%(searchterm)s"dict(searchterm=searchterm),
"http city3 /%(searchterm)s"dict(searchterm=searchterm),

我认为可以url_array通过从城市数组中调用这些城市的索引来减少我的代码,将城市数组解析为这些城市的索引,这些城市在目标数组中使用循环声明来声明。

这在技术上可行吗?我的下一步应该是什么?我应该谷歌什么?

cities = ["hamburg", "berlin", "muenchen"]
citiesCount = len(cities)

url_array = [
http:"%(cities[1])s"
while citiesCount in range(1, len(cities):
    http:"%(cities[0+1]s"
    ]
4

1 回答 1

2

您的示例 URL 没有多大意义,而且问题本身(仍然,我编辑掉了最糟糕的部分)难以阅读和理解。如果可能,请尝试对其进行编辑并使其更清晰。

我不确定,但听起来你想使用列表推导

url_array = [ "http://%s/stuff" % x for x in cities ]

会产生:

url_array = [ "http://hamburg/stuff", "http://berlin/stuff" ... ]
于 2012-09-05T09:03:55.237 回答