所以我正在研究urllib3,因为它具有连接池并且是线程安全的(因此性能更好,尤其是对于爬网),但文档是......至少可以说是最少的。urllib2 有 build_opener 所以类似:
#!/usr/bin/python
import cookielib, urllib2
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
r = opener.open("http://example.com/")
但是 urllib3 没有 build_opener 方法,所以到目前为止我想出的唯一方法是手动将它放在标题中:
#!/usr/bin/python
import urllib3
http_pool = urllib3.connection_from_url("http://example.com")
myheaders = {'Cookie':'some cookie data'}
r = http_pool.get_url("http://example.org/", headers=myheaders)
但我希望有更好的方法,你们中的一个可以告诉我它是什么。也有人可以用“urllib3”标记这个。