我正在使用 parquet 文件格式从 2 个红移表中导出数据。
unload ('select * from some_table')
to 's3://132cols/some_table/'
credentials 'aws_access_key_id=xxx;aws_secret_access_key=xxxx'
PARQUET
PARTITION BY (senderid) include;
unload ('select * from another_table')
to 's3://132cols/another_table/'
credentials 'aws_access_key_id=xxx;aws_secret_access_key=xxxx'
PARQUET
PARTITION BY (senderid) include;
数据按 senderid 分区,因此我可以看到 2 个文件夹,例如...
s3://132cols/some_table/senderid=abcd/
s3://132cols/another_table/senderid=abcd/
这两个表具有相同的结构,并且两者中都存在相同的 ID。有没有办法合并这两个文件夹来查询与 Athena 中的两个表(或 redshift)中的发件人“abcd”相关的数据?