Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
EMR 和 Scan 都将解析整个表并消耗请求积分,但 EMR 还需要使用 ec2 实例,因此成本更高。
所以,我想知道在哪种情况下 EMR 比 Scan on Amazon 的 Dynamo-DB 更适合?
对不起 - 我不完全确定我理解你的问题。
如果您问为什么要使用 EMR 扫描整个 DynamoDB 表而不是直接进行扫描,答案是速度和简单性。
如果您将 Hive 之类的东西与 DynamoDB Serde 一起使用,则可以比直接查询 DynamoDB 更快地提取 DynamoDB 表的全部内容,因为扫描将是并行的。
DynamoDB 经常支持一致的读取性能,当查询 DynamoDB 表时,瓶颈转移到客户端能够足够快地读取数据。