有没有办法保留来自 Athena 的查询的顺序?假设 s3 存储桶或数据湖中的数据已分区并位于 parquet 文件中。每次我查询一些东西,每次的顺序都不一样。我不确定 Athena 是如何工作的,但是让多个工作人员执行性能查询并将结果组合在一起是有意义的,这将是为什么每次顺序都不同的原因。但是,如果所有数据都来自单个 parquet 文件,是否可以保留结果的顺序?
问问题
179 次
有没有办法保留来自 Athena 的查询的顺序?假设 s3 存储桶或数据湖中的数据已分区并位于 parquet 文件中。每次我查询一些东西,每次的顺序都不一样。我不确定 Athena 是如何工作的,但是让多个工作人员执行性能查询并将结果组合在一起是有意义的,这将是为什么每次顺序都不同的原因。但是,如果所有数据都来自单个 parquet 文件,是否可以保留结果的顺序?