此脚本确定可能数量的网站中哪些网站拥有我想要的数据。z
通过 运行所有潜在网站data_grabber(item)
,它返回所有有效 URL 的索引列表。它还包括None
无效网站的值。
import requests
a = range(0, 10)
b = 'http://www.grandexchangecentral.com/include/gecgraphjson.php?jsid=%r'
websites = []
for i in a:
result = b % a[i]
websites.append(result)
def data_grabber(item):
url = item
r = requests.get(url, headers={'Referer': 'www.grandexchangecentral.com'})
data = r.json
if data != None:
return websites.index(item)
z = [data_grabber(x) for x in websites]
z1 = filter(None, z)
这将返回[None, None, 2, None, None, None, 6, None, 8, None]
,z1
缩短为[2, 6, 8]
。唯一的问题是可能的网站列表可能会变得很长,因此可能需要几分钟才能None
在z
. 是否可以防止z
生成None
项目?提前感谢您的帮助。
编辑:现在我意识到它实际上data_grabber
花费了大部分时间。不过还是很高兴知道这一点。