我正在使用 web.py 构建一个 Web 服务,并使用 S3 来存储文件。我的 Web 服务的一部分有一个“提交”方法(类似于 SVN/Git),它接收用户本地文件夹中的文件列表并将它们与当前已上传的文件进行比较(通过 md5 散列本地文件,并保留远程文件哈希的数据库记录)。然后客户端压缩自上次“提交”以来添加或修改的文件,并将此压缩文件上传到服务器。然后服务器解压缩并将文件放在应有的位置,使用新的哈希值更新数据库。
但是,我希望这是一个可扩展的 Web 服务,并且处理大量 zip 存档将是一个问题。我想到了两种可能的方法:
- 一次处理一个文件 - 服务器在上载最后一个文件时请求每个文件。
- 找到绕过我的服务器并让用户直接上传到 S3 的方法。但是,用户仍应在我的服务器上进行身份验证!
我对网络服务很陌生,所以任何建议都将不胜感激。不用说,我希望这些事务在内存和处理时间方面尽可能便宜。