我正在查看有关在 EMR 上启用加密的 AWS 文档,但我找不到任何有关这如何影响 Parquet 文件性能的信息。EMR 在优化查询时还能利用 Parquet 吗?
例子:
select count(1) from my_table
只会扫描 parquet 文件中的元数据,不需要下载整个文件。
select column from my_table
只会获取该特定列的数据。
当文件被加密时,这怎么可能?
我正在查看有关在 EMR 上启用加密的 AWS 文档,但我找不到任何有关这如何影响 Parquet 文件性能的信息。EMR 在优化查询时还能利用 Parquet 吗?
例子:
select count(1) from my_table
只会扫描 parquet 文件中的元数据,不需要下载整个文件。
select column from my_table
只会获取该特定列的数据。
当文件被加密时,这怎么可能?