我有来自 Netezza 表的 sqoopd 数据,输出文件在 HDFS 中,但是一列是时间戳,我想将它作为日期列加载到我的配置单元表中。使用该列我想在日期创建分区。我怎样才能做到这一点?
示例:在 HDFS 中的数据就像 = 2013-07-30 11:08:36
在蜂巢中,我只想加载日期(2013-07-30)而不是时间戳。我想每天对该列进行分区。
如何动态地按列传递分区?
我尝试将数据加载到一个表中作为源。在最终表中,我将通过 (date_column=dynamic date) select * from table1 插入覆盖表分区