0

我想根据数字范围对 hive 中的外部表进行分区。说 1 到 100 的数字进入一个分区。是否有可能在蜂巢中做到这一点?

4

1 回答 1

1

我在这里假设您有一个包含一些记录的表,您希望从中将数据加载到外部表,该表由某个字段分区,例如 RANGEOFNUMS。

现在,假设我们有一个名为 testtable 的表,其中包含列名称和值。内容就像

India,1 
India,2 
India,3 
India,3 
India,4 
India,10 
India,11 
India,12 
India,13 
India,14 

现在,假设我们有一个名为 testext 的外部表,其中包含一些列以及一个分区列,例如 RANGEOFNUMS。

现在你可以做一件事,

insert into table testext partition(rangeofnums="your value")
select * from testtable where value>=1 and value<=5;

这样,testtable 中值为 1 到 5 的所有记录都将进入外部表的一个分区。

这个场景只是我的假设。如果这不是您所拥有的场景,请发表评论。

阿秋

于 2013-07-18T08:19:26.347 回答