我创建了一个名为employee (avro 格式)的配置单元表,并在部门上进行了分区。
我的 HDFS 位置中有 avro 数据集。我的数据集也有部门 ID。
我想使用来自 HDFS 的数据将数据导入 Hive 表。在导入期间,我希望将数据保存在其各自的分区中。
如何做到这一点?任何想法?
我创建了一个名为employee (avro 格式)的配置单元表,并在部门上进行了分区。
我的 HDFS 位置中有 avro 数据集。我的数据集也有部门 ID。
我想使用来自 HDFS 的数据将数据导入 Hive 表。在导入期间,我希望将数据保存在其各自的分区中。
如何做到这一点?任何想法?