所以基本上我正在尝试在使用 python 的 windows 上使用来自 scrapinghub 的 Crawlera 代理和 selenium chrome。
我检查了文档,他们建议像这样使用 Polipo:
1) 将以下行添加到 /etc/polipo/config
parentProxy = "proxy.crawlera.com:8010"
parentAuthCredentials = "<CRAWLERA_APIKEY>:"
2)将此添加到硒驱动程序
polipo_proxy = "127.0.0.1:8123"
proxy = Proxy({
'proxyType': ProxyType.MANUAL,
'httpProxy': polipo_proxy,
'ftpProxy' : polipo_proxy,
'sslProxy' : polipo_proxy,
'noProxy' : ''
})
capabilities = dict(DesiredCapabilities.CHROME)
proxy.add_to_capabilities(capabilities)
driver = webdriver.Chrome(desired_capabilities=capabilities)
现在我不想使用 Polipo 并直接使用代理。
有没有办法替换 polipo_proxy 变量并将其更改为 crawlera 变量?每次我尝试这样做时,它都不会考虑它并且在没有代理的情况下运行。
Crawlera 代理格式如下所示:[API KEY]:@[HOST]:[PORT]
我尝试使用以下行添加代理:
chrome_options.add_argument('--proxy-server=http://[API KEY]:@[HOST]:[PORT])
但问题是我需要以不同的方式指定 HTTP 和 HTTPS。
先感谢您!