我刚刚部署了 Hive 2.4.3,但是在旧版本的 Hive 1.2 上几乎没有带有分区的现有表,我使用 Derby 作为元数据存储。
将它们迁移到 Hive 的新安装的最佳方法是什么?
我刚刚部署了 Hive 2.4.3,但是在旧版本的 Hive 1.2 上几乎没有带有分区的现有表,我使用 Derby 作为元数据存储。
将它们迁移到 Hive 的新安装的最佳方法是什么?
在新配置单元中创建外部表并使用此命令创建分区元数据
MSCK [REPAIR] TABLE tablename;
Amazon Elastic MapReduce (EMR) 的 Hive 版本上的等效命令是:
ALTER TABLE tablename RECOVER PARTITIONS;
这将添加 Hive 分区元数据。请参阅此处有关这两个命令的手册:RECOVER PARTITIONS