0

有没有办法制作 Hive 表转储,以便可以发送表转储并重新加载到 Hive 中,保留分区、分桶结构?

4

2 回答 2

1

Hive 0.8(及更高版本)为我们提供了EXPORT. 使用此功能,我们可以将表中的数据与相应的元数据一起导出到 HDFS 文件中。数据以 json 格式存储。IMPORT以这种方式导出的数据可以使用该命令导入回另一个数据库或配置单元实例。

有关更多详细信息,请参阅内容。

于 2013-07-03T12:08:58.887 回答
0

基本上,您要做的一件事是将加载到配置单元表(例如 A)中的文件(转储)并将其视为转储。现在,在将该文件重新加载到其他 Hive 表(比如 B)时,您实际上可以基于先前的 Hive 表(即 A)创建 B。要创建类似于 A 的 B,您可以使用 org.apache.hadoop.hive.metastore.HiveMetastoreClient 类来访问表 A 的元存储信息。然后您可以加载文件(转储)并加载到所需的分区。

于 2013-07-03T12:20:43.090 回答