2

我很想使用 Sqoop,但不认为仅仅为此而在 ElasticMapReduce(我真的很喜欢)上运行 Cloudera 堆栈@AWS 是不值得的。

我目前的想法只是将我需要的数据写入到@S3 的外部表中,然后编写脚本将其导入mysql。亚马逊有一些 SimpleDB 的东西(例子),但我也不确定那条路线?对生活在 S3 的数据很好,只是想知道是否有人有更好的主意。

谢谢!

4

1 回答 1

2

我使用并且效果很好的最简单的解决方案:

  1. 正如您建议的那样,将您的数据放入 S3 存储桶中。您可以创建一个托管在 S3 上并具有例如制表符分隔格式的表。如果你在最后一步使用一个 reducer,你最终只会得到一个文件。
  2. 将数据下载到您的 MySQL 服务器,我最喜欢的工具是s3cmd
  3. 使用 LOAD DATA INFILE 将数据直接导入 MySQL...
于 2012-01-31T01:15:59.740 回答