0

我有一堆 Athena 表,这些表是从我持续注入 S3 的数据中生成的,我想将这些数据与 QuickSight 一起使用。我取得了一些成功,但是对于某些数据,我在刷新 QS 时会超时。我最好在 Athena 中进行视图以执行所有连接等,然后将其放入 QS 中进行报告,还是应该将基表放入 QS 并在那里进行连接和其他数据操作?

4

2 回答 2

1

Athena 视图不是物化视图,因此它们对您没有太大帮助。

https://docs.aws.amazon.com/athena/latest/ug/when-to-use-views.html

相反,我建议在加载到 QS 之前使用 AWS Glue 作业转换您的数据。您还可以考虑对源数据进行分区或压缩。我也经常使用带有快速压缩的镶木地板格式。

https://aws.amazon.com/blogs/big-data/top-10-performance-tuning-tips-for-amazon-athena/

于 2018-10-03T15:58:04.747 回答
0

需要考虑的一件事是,如果您在 Athena 中进行所有连接,数据集的大小可能会更大并且需要更多的 QS 存储。QS 现在也允许加入 QS 数据集。

https://docs.aws.amazon.com/quicksight/latest/user/joining-data.html

此外,如果使用这种方法,则连接的表的大小是有限的。

于 2022-01-13T21:28:16.983 回答