该文档
给出了一个非常清楚的代理使用示例
import requests
proxies = {
'http': 'http://10.10.1.10:3128',
'https': 'http://10.10.1.10:1080',
}
requests.get('http://example.org', proxies=proxies)
然而,没有记录的是,即使架构相同,您甚至可以为单个 url 配置代理!当您想为要抓取的不同网站使用不同的代理时,这会派上用场。
proxies = {
'http://example.org': 'http://10.10.1.10:3128',
'http://something.test': 'http://10.10.1.10:1080',
}
requests.get('http://something.test/some/url', proxies=proxies)
此外,requests.get
基本上使用requests.Session
引擎盖下,所以如果你需要更多的控制,直接使用它
import requests
proxies = {
'http': 'http://10.10.1.10:3128',
'https': 'http://10.10.1.10:1080',
}
session = requests.Session()
session.proxies.update(proxies)
session.get('http://example.org')
我用它来设置一个后备(默认代理)来处理与字典中指定的架构/url不匹配的所有流量
import requests
proxies = {
'http': 'http://10.10.1.10:3128',
'https': 'http://10.10.1.10:1080',
}
session = requests.Session()
session.proxies.setdefault('http', 'http://127.0.0.1:9009')
session.proxies.update(proxies)
session.get('http://example.org')