目前,我们正在将所有用户生成的内容上传到一个中型 EC2 实例,然后我们从那里运行一个 cron 作业以将所有上传的内容同步到 S3。我们有一些在后端运行的代码(每次您需要访问任何上传的文件时)检查资源是否已移动到 S3,或者它是否仅在我们的上传实例上可用。
这似乎有点浪费,但它确实提供了冗余——如果 S3 关闭,我们有一些 JavaScript 代码可以强制从我们的上传框提供文件。实际文件上传存储在 EBS 中,而不是实例上。
我们现在在 S3 存储桶中有大约 150GB 的文件;这使得执行 S3 存储桶的单独备份非常耗时,并且几乎不可能定期运行。
所以,我的问题是,这甚至有必要吗?谁能指出我在 S3 和 EC2 之间的一些正常运行时间统计数据?是否曾经发生过 S3 已关闭但 EC2 可用的情况?似乎将所有内容直接上传到 S3 并相信它已经启动可能更简单......另一方面,我们可以将所有内容存储在 EBS 中而完全忘记 S3,这似乎更有意义。