2

我是新来的蜂巢。我的输入文件的格式为(ID,日期(YYYY-MM-DD),小时(HH),键,值)。表在(日期,小时)分区输入文件包含7天的数据(24小时为每天)。当我将此数据加载到配置单元表中时,我需要将数据加载到表的各个分区中。可以请一些帮助我。

谢谢,苏达卡尔。

4

1 回答 1

4

一种方法是首先将数据加载到未分区的表中(例如下面示例中的 tmp_some_table)。然后您可以执行以下操作:

  set hive.exec.dynamic.partition=true;
  set hive.exec.dynamic.partition.mode=nonstrict;
  from tmp_some_table tt
  insert overwrite table some_table partition(day, hour)
  select
    id,
    key,
    value, 
    day,
    hour

分区必须是 select 子句中的最后一列。以上适用于 hive 0.7.1。有关更多信息,请参阅wiki。请注意,如果您有太多的分区,您会得到错误

于 2012-07-28T02:31:38.390 回答