我想根据数字范围对 hive 中的外部表进行分区。说 1 到 100 的数字进入一个分区。是否有可能在蜂巢中做到这一点?
问问题
605 次
1 回答
1
我在这里假设您有一个包含一些记录的表,您希望从中将数据加载到外部表,该表由某个字段分区,例如 RANGEOFNUMS。
现在,假设我们有一个名为 testtable 的表,其中包含列名称和值。内容就像
India,1
India,2
India,3
India,3
India,4
India,10
India,11
India,12
India,13
India,14
现在,假设我们有一个名为 testext 的外部表,其中包含一些列以及一个分区列,例如 RANGEOFNUMS。
现在你可以做一件事,
insert into table testext partition(rangeofnums="your value")
select * from testtable where value>=1 and value<=5;
这样,testtable 中值为 1 到 5 的所有记录都将进入外部表的一个分区。
这个场景只是我的假设。如果这不是您所拥有的场景,请发表评论。
阿秋
于 2013-07-18T08:19:26.347 回答