2

我正在阅读使用 Hive 在 DynamoDB 上查询数据的以下集成。 http://aws.typepad.com/aws/2012/01/aws-howto-using-amazon-elastic-mapreduce-with-dynamodb.html

但是根据该链接,需要在 EMR 之上设置 Hive。但是我想知道我是否可以将这种集成与我已经拥有的独立 Hadoop 集群一起使用,而不是使用 EMR。有人做过吗?与使用 EMR 相比,DynamoDB 和 HDFS 中的数据会不会出现同步问题?

4

1 回答 1

0

为了能够在您自己的集群上使用它,您需要用于 DynamoDB 的自定义StorageHandler(它可能还涉及自定义SerDe)。

目前似乎没有,至少在 AWS 网站上没有。

您可以做的是使用 Amazon 提供的JDBC 接口从您的集群中生成查询,但它仍将在 EMR 之上执行。

于 2012-04-19T14:45:37.070 回答