我是 Python 的新手,我正在尝试构建一个简单的脚本来下载用于解析内容的远程 HTML 文件。
我需要同时使用代理和启用 cookie 的环境来向 remore 系统进行身份验证。
只要我只使用一个处理程序,一切都很好。但是,一旦我尝试使用 Cookie 处理程序和代理处理程序的组合,python 脚本就会在第一次连接时引发异常。
self.cj = CookieJar()
proxy_support = urllib2.ProxyHandler({"http":"http://193.104.35.23:80"})
self.opener = urllib2.build_opener(proxy_support, urllib2.HTTPCookieProcessor(self.cj))
urllib2.install_opener(self.opener)
self.opener.open('http://www.mysite.com').read()
在控制台中,我收到以下消息。
pydev调试器:无法找到真实位置:/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/UserDict.py pydev调试器:无法找到真实位置:/System/Library/Frameworks /Python.framework/Versions/2.7/lib/python2.7/fnmatch.py pydev 调试器:无法找到真实位置:/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/posixpath .py
一旦脚本开始执行,就会出现类似这样的其他一些错误,但是如果不使用代理,一切都会运行良好。
另外,过了一会儿,脚本以此结束
urllib2.HTTPError:HTTP 错误 500:内部服务器错误
这是不言自明的,但我不明白问题出在哪里,因为我已获准在 IP 基础上使用该代理服务器(这意味着只有我在办公室才能使用该地址)。
有什么帮助吗?