现在我暂时有这个代码:
import json
import urllib2
with open('proxies.txt') as proxies:
for line in proxies:
proxy = json.loads(line)
proxy_handler = urllib2.ProxyHandler(proxy)
opener = urllib2.build_opener(proxy_handler)
urllib2.install_opener(opener)
with open('urls.txt') as urls:
for line in urls:
url = line.rstrip()
data = urllib2.urlopen(url).read()
print data
我的 proxies.txt 文件如下:
{"https": "https://94.142.27.4:3128"}
{"http": "http://118.97.95.174:8080"}
{"http": "http://66.62.236.15:8080"}
我的 urls.txt 文件如下:
http://www.google.com
http://www.facebook.com
http://www.reddit.com
似乎它正在安装所有代理,然后在安装了所有代理的情况下处理列表中的每个 url。不过,我真正想要的是让它通过每个代理单独访问每个 url。所以
- 通过代理 1 访问 url1
- 通过代理1访问url2
- 通过代理1访问url3
- 通过代理 2 访问 url1
- 通过代理 2 访问 url2
- 通过代理2访问url3
- 通过代理 3 访问 url1
- 通过代理 3 访问 url2
- 通过代理 3 访问 url3
有没有办法做到这一点?它已经在这样做了吗?我是否误解了代理的真正含义?我是否误解了 install_opener 的真正作用?