0

我想使用 Amazon Athena 将现在位于 Amazon S3 上的 csv 数据文件转换为 Parquet 格式,并将它们推回 Amazon S3,而不需要 Amazon EMR 的任何帮助。这有可能做到吗?有没有人经历过类似的事情?

4

1 回答 1

1

Amazon Athena 可以查询数据,但不能转换数据格式

您可以使用Amazon EMR转换为列格式。步骤是:

  • 创建指向源数据的外部表
  • 创建一个目标外部STORED AS PARQUET
  • INSERT OVERWRITE <destination_table> SELECT * FROM <source_table>
于 2018-02-09T03:10:40.570 回答