Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
谁能解释对 Hive 表进行分区的意义。
如果我创建一个表并按日期对其进行分区。在 hdfs 中,它显示为文件名.. 或子文件。这是什么意思?
谁能解释一下这个概念?
您已经加载了一个分区,即带有整个数据集的“年龄等于 22”分区。因此,表中的所有行的年龄都为 22。
如果您在语句中指定一个分区,它将写入该分区。您可能需要动态分区,您可以在其中创建从某些 select 语句中提取的分区。
通常,在 Hive 中进行分区的目的是提高性能并构建表以反映已知的访问模式和使用情况——例如,我总是按年龄查询我的表。