我正在为一个大学项目使用 Amazons MapReduce Web Service。为了将数据用于 MapReduce,我需要将它们从关系数据库 (AWS RDS) 转储到 S3。MapReduce 完成后,我需要拆分输出文件并将其大块加载到他们自己的 S3 存储桶中。
在 Amazon Web Services 环境中执行此操作的好方法是什么?
最佳情况:除了用于 RDS 和 MapReduce 的实例之外,这是否可以在不使用额外 EC2 实例的情况下完成?
我将 python 用于 mapper 和 reducer 函数,并将 json 说明符用于 MapReduce 作业流。否则我不受语言或技术限制。