Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我们可以在 Hive 表的分区内进行分区吗?
我的意思是我们可以对分区表进行分区吗?还是分桶是 Hive 表中的唯一选择?
Hive 支持多级分区。但请记住,在 Hive 中拥有多个分区几乎从来都不是一个好主意。HDFS 确实针对处理大文件进行了优化,大约 100MB 或更大。Hive 表的每个分区都是一个 HDFS 目录。每个目录中通常有多个文件。您确实应该关闭 PB 的数据以在 Hive 表中进行多级分区。
你想解决什么问题?我相信我们可以找到一个明智的解决方案。