1

我们的 s3 存储桶通常有许多子目录,因此存储桶的路径类似于 s3:functional-group/service/org-tenant-company-id/entity-id/actual-data

我们正在研究 Athena 是否能够在该 /actual-data 级别上查询数据,但在 org-tenant-company-id 内。因此,我们似乎需要一种方法来为该 org-tenant-company-id 创建列或分区。这可能吗?

我已阅读 Athena 文档中有关分区的页面。似乎我们可能必须通过 JDBC 驱动程序手动创建分区?

4

2 回答 2

0

您可以使用路径作为属性(如何获取输入文件名作为 AWS Athena 外部表中的列)并使用 CTAS 创建分区。

于 2020-04-15T13:53:42.323 回答
0

是的,您可以手动创建分区,但是如果您以配置单元格式设置文件夹结构,例如(s3:functional-group/service/org-tenant-company-id=xxxx/),您可以简单地执行“MSCK REPAIR TABLE”命令,Athena 会自动为您创建所有分区。

于 2017-06-14T18:40:30.473 回答