apache-spark - 如何在临时 EMR 集群中使用表分桶？

问问题 2017-10-16T22:02:28.387

116 次

1

我在 EMR 上使用带有临时集群的 Spark 2.2。我想使用火花分桶，我不关心 Hive（仅限 Spark 工作负载）。

我可以使用spark.sql.warehouse.dirs3 存储桶来保存元存储信息以使它们不依赖于集群吗？

我还需要一个存放位置metastore_db吗？

幕后发生了什么？此命令显示的存储信息在哪里：spark.catalog.listTables.show？

0 回答 0