7

可能是我遗漏了一些东西,但我无法理解如果我将 Athena 与 QuickSight 连接而不是将 QuickSight 直接与 S3 连接,我将获得什么好处。请帮助我理解这一点。

4

1 回答 1

11

Amazon S3 是一种对象存储,用于存储和检索任意数量的数据。基本上,它有一些原始数据或非结构化数据(以某种文件格式 .csv.tsv)。

Amazon Athena 使用托管数据目录来存储有关您为存储在 Amazon S3 中的数据创建的数据库和表的信息和架构。因此,Athena 知道 S3 中的数据及其结构(即某些模式)。

此外,QuickSight 可以直接连接到 Athena 数据库并查询数据进行分析。当您连接到 Athena 数据库时,您最有可能处理结构化或半结构化数据

当数据源是 Amazon Athena 时,不需要Amazon S3 清单文件。

直接连接到 S3 时的一些限制:-

清单中指定的文件大小不能超过 1 GB,指定的所有文件的总大小不能超过 10 GB,指定的文件总数不能超过 1000。

当您使用使用 Amazon Athena 数据创建数据集时,上述限制不可用。

使用 Amazon Athena 数据创建数据集时的另一个功能:-

您可以直接分析数据而无需加载或加载到 SPICE 并分析数据。

结论:-

如果您尚未对 S3 文件执行任何操作,则可以直接使用 QuickSight,将 S3 用作数据集。

如果您已将 S3 数据加载到 Athena 中,则可以将 Athena 用作 QuickSight 的数据集。

通过使用 Athena 或任何其他数据源,您将获得很少的好处,并且可以克服上面提到的一些限制(即文件大小)。

于 2017-11-17T16:26:27.090 回答