我们希望在当前数据库之上使用 Amazon Elastic MapReduce(我们在 EC2 上使用 Cassandra)。查看 Amazon EMR 常见问题,应该可以: Amazon EMR 常见问题: 问:我可以从 Internet 或 Amazon S3 以外的其他地方加载我的数据吗?
但是,在创建新的作业流时,我们只能将 S3 存储桶配置为输入数据源。
关于如何做到这一点的任何想法/示例?
谢谢!
PS:我已经看到了这个问题How to use external data with Elastic MapReduce但答案并没有真正解释如何去做/配置它,只是它是可能的。