我这样做是为了获取一些数据:
c = pycurl.Curl()
c.setopt(pycurl.ENCODING, 'gzip')
c.setopt(pycurl.URL, url)
c.setopt(pycurl.TIMEOUT, 10)
c.setopt(pycurl.FOLLOWLOCATION, True)
xml = StringIO()
c.setopt(pycurl.WRITEFUNCTION, xml.write )
c.perform()
c.close()
我的网址通常是这样的:
http://host/path/to/resource-foo.xml
通常我会返回 302 指向:
http://archive-host/path/to/resource-foo.xml.gz
鉴于我设置了 FOLLOWLOCATION 和 ENCODING gzip,一切正常。
问题是,有时我的 URL 不会导致重定向到 gzip 压缩的资源。发生这种情况时,c.perform()
会引发此错误:
pycurl.error: (61, 'Error while processing content unencoding: invalid block type')
这向我表明 pycurl 正在尝试对未压缩的资源进行压缩。
有什么方法可以指示 pycurl 找出响应编码,以及 gunzip 或不合适吗?我玩过使用不同的值ENCODING
,但到目前为止还没有豆子。
pycurl 文档似乎有点缺乏。:/
谢谢!