python - 如何使用 urllib2 将经过身份验证的代理异常应用于开启程序？

Question

在 Windows 上使用 urllib2（可能还有 urllib）时，python 似乎神奇地获取了应用于 InternetExplorer 的经过身份验证的代理设置。但是，它似乎没有检查和处理高级设置“例外”列表。

有没有办法让它处理例外列表？或者，忽略 IE 代理设置并应用我自己的代理开启器来解决这个问题？

我之前玩过创建代理开启器，但无法让它工作。这是我设法挖掘出来的内容，但我仍然看不到如何/在哪里应用任何例外，我什至不确定这是否正确：

proxy_info = {
                      'host':'myproxy.com',
                      'user':Username,
                      'pass':Password,
                      'port':1080
                      }                                                   

http_str = "http://%(user)s:%(pass)s@%(host)s:%(port)d" % proxy_info

authInfo = urllib2.HTTPBasicAuthHandler()
authInfo.add_password()
proxy_dict = {'http':http_str}
proxyHandler = urllib2.ProxyHandler(proxy_dict)

# apply the handler to an opener
proxy_opener = urllib2.build_opener(proxyHandler, urllib2.HTTPHandler)

urllib2.install_opener(proxy_opener)

score 2 · Accepted Answer

默认情况下urllib2，从环境变量中获取代理设置，这就是它使用 IE 设置的原因。这非常方便，因为您不需要自己设置身份验证。

您不能像您想要的那样应用例外，最简单的方法是拥有两个openers 并根据域是否在您的例外列表中来决定使用哪一个。

当你想使用代理时使用默认值opener，当你不需要它时使用没有代理：

>>> no_proxy = urllib2.ProxyHandler({})
>>> opener = urllib2.build_opener(no_proxy)
>>> urllib2.install_opener(opener)

从这里。

编辑：

这是我的做法：

exclusion_list = ['http://www.google.com/', 'http://localhost/']

no_proxy = urllib2.ProxyHandler({})
no_proxy_opener = urllib2.build_opener(no_proxy)

default_proxy_opener = urllib2.build_opener()

url = 'http://www.example.com/'

if url in exclusion_list:
    opener = no_proxy_opener
else:
    opener = default_proxy_opener

page = opener.open(url)
print page

您最大的问题是将 url 与排除列表匹配，但这是一个全新的问题。

python - 如何使用 urllib2 将经过身份验证的代理异常应用于开启程序？

1 回答 1

Related

Reference