0

我有多个现有的表存储在 hdfs 中。我想从现有的外部表创建新表,以便我可以对数据进行存储、排序和压缩。

从现有表创建表的正确方法是什么?我可以将现有表导出到 CSV,然后创建一个新表并将其导入,但似乎应该有一种方法可以直接从现有表中导入数据,但我在文档中或通过谷歌没有找到任何内容。

4

1 回答 1

1

对于一些名为:的现有表source和一个名为:的新表target,其中包含字段:a,b,c,d

从源读取所有条目并写入目标:

insert overwrite table target select distinct a,b,c,d from source;

这适用于内部和外部表。

于 2015-07-13T21:43:20.067 回答