我有一些日志数据,有字段
- id、tdate、信息
我创建了一个动态分区表
CREATE TABLE log_partitioned(id STRING, info STRING)
PARTITIONED BY ( tdate STRING)
然后我正在加载数据
FROM logs lg
INSERT OVERWRITE TABLE log_partitioned PARTITION(tdate)
SELECT lg.id, lg.info, lg.tdate
DISTRIBUTE BY tdate;
它通过动态分区成功加载数据。但是当我试图查看数据时
hdfs dfs -cat /user/hive/warehouse/log_partitioned/tdate=2000-11-05/part-r-00000
那里只有两列值。
id1,信息1
id2,信息2 ....
如果我们运行 hive 查询
select * from log_partitioned limit 10
它显示了所有三列。我应该怎么做那个配置单元还将分区列存储在基础数据中?