我有一堆 Athena 表,这些表是从我持续注入 S3 的数据中生成的,我想将这些数据与 QuickSight 一起使用。我取得了一些成功,但是对于某些数据,我在刷新 QS 时会超时。我最好在 Athena 中进行视图以执行所有连接等,然后将其放入 QS 中进行报告,还是应该将基表放入 QS 并在那里进行连接和其他数据操作?
问问题
1769 次
2 回答
1
Athena 视图不是物化视图,因此它们对您没有太大帮助。
https://docs.aws.amazon.com/athena/latest/ug/when-to-use-views.html
相反,我建议在加载到 QS 之前使用 AWS Glue 作业转换您的数据。您还可以考虑对源数据进行分区或压缩。我也经常使用带有快速压缩的镶木地板格式。
https://aws.amazon.com/blogs/big-data/top-10-performance-tuning-tips-for-amazon-athena/
于 2018-10-03T15:58:04.747 回答
0
需要考虑的一件事是,如果您在 Athena 中进行所有连接,数据集的大小可能会更大并且需要更多的 QS 存储。QS 现在也允许加入 QS 数据集。
https://docs.aws.amazon.com/quicksight/latest/user/joining-data.html
此外,如果使用这种方法,则连接的表的大小是有限的。
于 2022-01-13T21:28:16.983 回答