2

远程服务器上文件的大小通常由 content-length 标头报告,但它是不可靠的。有时它会丢失,有时它会被误报。我不想完全依赖此标头来确定我的代码是否应该下载 URL。

有没有办法在下载文件时监控文件的大小并在超过最大大小时终止下载?

4

1 回答 1

4

您可以做的是读取您想要的最大文件大小,然后通过再读取一次来检查是否有更多字节要读取。像这样:

resp = urllib2.urlopen('http://www.google.com')
file_read = resp.read(max_wanted_size)
if resp.read(1) != '':
    #file is bigger than expected code
于 2012-04-23T23:34:27.663 回答