2

我可以运行以下代码:

import httplib2

h = httplib2.Http('.cache')

response, content = h.request('http://2.bp.blogspot.com/-CXFfl9luHPM/TV-Os6opQfI/AAAAAAAAA2E/oCgrgvWqzrY/s1600/cow.jpg')

print(response.status)

with open('cow.jpg', 'wb') as f:
    f.write(content)

当我运行代码时,我下载了一个名为 cow.jpg 的文件,这正是我想要的,但我也得到了一个具有不同名称的重复图像:2.bp.blogspot.com,-CXFfl9luHPM,TV-Os6opQfI,AAAAAAAAA2E, oCgrgvWqzrY,s1600,cow.jpg,77ba31012a25509bfdc78bea4e1bfdd1。它是带有逗号和其他垃圾的 http 地址。关于如何使用 httplib2 只创建一个图像的任何想法?谢谢。

4

3 回答 3

3

只需将内容写入文件:

with open('cow.jpg', 'wb') as f:
    f.write(content)
于 2012-02-19T18:17:17.460 回答
1

使用urllib和方法 urlretrieve,第二个参数是文件位置。

对于 python 2.x

import urllib
urllib.urlretrieve(URL, path_destination)
于 2012-02-19T18:21:21.627 回答
0

你也可以使用 urllib2 吗?如果是,您可以使用此功能:

def download_file(url):
    """Create an urllib2 request and return the request plus some useful info"""
    name = filename_from_url(url)
    r = urllib2.urlopen(urllib2.Request(url))
    info = r.info()
    if 'Content-Disposition' in info:
        # If the response has Content-Disposition, we take filename from it
        name = info['Content-Disposition'].split('filename=')[1]
        if name[0] == '"' or name[0] == "'":
            name = name[1:-1]
    elif r.geturl() != url:
        # if we were redirected, take the filename from the final url
        name = filename_from_url(r.geturl())
    content_type = None
    if 'Content-Type' in info:
        content_type = info['Content-Type'].split(';')[0]
    # Try to guess missing info
    if not name and not content_type:
        name = 'unknown'
    elif not name:
        name = 'unknown' + mimetypes.guess_extension(content_type) or ''
    elif not content_type:
        content_type = mimetypes.guess_type(name)[0]
    return r, name, content_type

用法:

fp, filename, content_type = download_file('http://url/to/some/file')
with open('somefile', 'w') as dst:
    shutil.copyfileobj(fp, dst)

此代码的优点是永远不会将整个文件读入内存 - 因此它也适用于大文件。除此之外,它还为您提供从服务器接收的文件名和内容类型,以防您需要/需要它。

于 2012-02-19T18:16:56.373 回答