我很想使用 Sqoop,但不认为仅仅为此而在 ElasticMapReduce(我真的很喜欢)上运行 Cloudera 堆栈@AWS 是不值得的。
我目前的想法只是将我需要的数据写入到@S3 的外部表中,然后编写脚本将其导入mysql。亚马逊有一些 SimpleDB 的东西(例子),但我也不确定那条路线?对生活在 S3 的数据很好,只是想知道是否有人有更好的主意。
谢谢!
我很想使用 Sqoop,但不认为仅仅为此而在 ElasticMapReduce(我真的很喜欢)上运行 Cloudera 堆栈@AWS 是不值得的。
我目前的想法只是将我需要的数据写入到@S3 的外部表中,然后编写脚本将其导入mysql。亚马逊有一些 SimpleDB 的东西(例子),但我也不确定那条路线?对生活在 S3 的数据很好,只是想知道是否有人有更好的主意。
谢谢!
我使用并且效果很好的最简单的解决方案: