在boto/s3模块中有一个函数被调用set_contents_from_filename
,它似乎将 md5 哈希作为参数。
但是文档并不清楚何时/如何计算哈希值。有人可以帮我解决这个问题吗?另外,如何将哈希信息保存到文件中?
正如@garnatt 已经说过的,该set_contents_from_filename
方法会自动为您计算 MD5 校验和。
如果您查看文档,有一个方法称为compute_md5
返回一个元组,该元组包含十六进制摘要中的 MD5 校验和(您在控制台中使用的内容md5sum
)以及 base64 编码,它发送到亚马逊,这就是您在标题中看到的内容。
该方法中的md5
参数以set_contents_from_filename
元组格式获取MD5校验和,compute_md5
返回方式相同。如果需要手动计算,最好的方法是使用compute_md5
方法。否则,您必须在将元组传递给md5
参数之前以正确的格式构建元组。
该set_contents_from_filename
方法将自动为您计算 MD5 校验和。此方法有一个可选md5
参数,如果您在应用程序中出于某种原因已经计算过 MD5,则允许您传入它,但如果您没有传入值,boto 将为您计算它。
boto计算的MD5是校验和的base 64编码。要上传/已上传的给定文件的标头中的“Content-MD5”可以通过以下方式计算:
import hashlib, base64
conn = S3Connection(access_key, secret_key)
bucket = conn.get_bucket('bucket_name')
#If you want to calculate MD5 of a file already uploaded
obj_key = bucket.get_key('file_name_in_s3')
content = obj_key.get_contents_as_string()
m = hashlib.md5()
m.update(content)
value = m.digest()
remote_md5 = base64.b64encode(value)
#To calculate md5 of a file to be uploaded to S3
cur_md5 = base64.b64encode(hashlib.md5(open('Local/Path/To/File').read()).digest())