python - 如何实际下载附件？

Question

我正在使用 urllib2 来（尝试）从网站下载文件。该文件只能在指定某些表单字段后才能下载。我可以毫无问题地创建请求并获得响应，如下所示：

req = urllib2.Request(url, data, headers)
response = urllib2.urlopen(req)

当我查看这样的响应标头时print response.info()['Content-Disposition']，我看到了那里的文件，即它打印出类似attachment;filename=myfile.txt

但是我如何实际下载附件？如果我这样做，response.read()我只会在 url 处得到一个包含页面 HTML 的字符串。关键是 url 不是一个文件，它是一个带有“附件”的网页，我正在尝试使用 urllib2 下载该附件。我相信附件是动态生成的，所以它不只是坐在服务器上。

score 2 · Accepted Answer

问题是我没有发送所有必要的标题。特别是，在请求标头中发送正确的 cookie 非常重要。我做了以下事情：

1 回答 1