我已经阅读了有关此内容的其他几篇文章,尤其是这个问题,其中 greg 回答了如何在 Hive 中执行此操作。我想知道如何解释具有可变列数的 DynamoDB 表?
也就是说,原始 DynamoDB 表的行是通过不同的列动态添加的。我试图查看 Amazon 在其 DataPipeLine 服务中使用的 exportDynamoDBToS3 脚本,但它的代码如下所示,似乎没有映射列:
-- Map DynamoDB Table
CREATE EXTERNAL TABLE dynamodb_table (item map<string,string>)
STORED BY 'org.apache.hadoop.hive.dynamodb.DynamoDBStorageHandler'
TBLPROPERTIES ("dynamodb.table.name" = "MyTable");
(顺便说一句,我也尝试过使用 Datapipe 系统,但发现它相当令人沮丧,因为我无法从文档中弄清楚如何执行简单的任务,例如运行 shell 脚本而不会一切都失败。)