2

我的特定场景:期望积累 TB 甚至 PB 的 JSON 数据条目,这些条目跟踪许多商品的价格历史记录。每天将数百甚至数千次新数据写入数据存储。这些数据将由 Redshift 和可能的 AWS ML 进行分析。我不希望在 Redshift 或 ML 之外进行查询。

问题:我如何决定应该将数据存储在 S3 还是 DynamoDB 中?我无法做出决定,因为我知道这两个存储都支持 redshift,但我确实注意到 Redshift Spectrum 专门针对 S3 数据而存在。

4

1 回答 1

2

首先,DynamoDB 比 S3 贵得多。S3只是一种存储方案;而 DynamoDB 是一个成熟的 NoSQL 数据库。

如果要使用 Redshift 进行查询;您必须将数据加载到 Redshift 中。Redshift 又是一个独立的成熟数据库(仓储解决方案)。

您可以使用 Athena 直接从 S3 查询数据。

于 2017-11-29T17:03:25.323 回答