1

我有一个带有 3 个分区列(A、B、C)的配置单元外部表,现在我想从分区中删除 B 和 C 列。可以这样做吗?我尝试过使用 Alter table tab_name drop column col_name; --- 但它会抛出一个错误,指出无法删除分区列。

4

1 回答 1

0

要删除分区列,应重新创建表。步骤是:

  1. 删除表,删除外部表不会删除数据文件。
  2. 重新组织数据文件夹以反映新的分区结构。分区是物理级别的文件夹,按层次组织。如果删除上一级分区,则所有子文件夹都应移至上一级,依此类推。如果您要删除两个上分区列并且只剩下一个,那么它应该只是表位置下的一级子文件夹。
  3. 在旧位置之上创建具有新分区架构的表。
  4. 运行MSCK repair table。它将为所有找到的分区文件夹创建分区元数据。

如果所有这些步骤看起来太复杂或太难做,那么只需创建新表并加载数据:

  1. 使用新的分区模式创建新表。
  2. 将数据加载到新表中。
  3. 删除旧表并重命名新表

像这样:

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
insert overwrite table new_table partition(C)
select --list columns without deleted 
from old_table;

最后,删除旧表后,您可以使用ALTER TABLE table_name RENAME TO new_table_name.

于 2018-12-03T16:53:06.023 回答