1

EMR 和 Scan 都将解析整个表并消耗请求积分,但 EMR 还需要使用 ec2 实例,因此成本更高。

所以,我想知道在哪种情况下 EMR 比 Scan on Amazon 的 Dynamo-DB 更适合?

4

1 回答 1

2

对不起 - 我不完全确定我理解你的问题。

如果您问为什么要使用 EMR 扫描整个 DynamoDB 表而不是直接进行扫描,答案是速度和简单性。

如果您将 Hive 之类的东西与 DynamoDB Serde 一起使用,则可以比直接查询 DynamoDB 更快地提取 DynamoDB 表的全部内容,因为扫描将是并行的。

DynamoDB 经常支持一致的读取性能,当查询 DynamoDB 表时,瓶颈转移到客户端能够足够快地读取数据。

于 2012-07-16T21:36:29.233 回答