我正在尝试将数据加载到 Kudu 表,但得到一个奇怪的结果。
在 Impala 控制台中,我从 Sqoop 导入的四个 HDFS 文件创建了一个外部表:
drop table if exists hdfs_datedim;
create external table hdfs_datedim
( ... )
row format
delimited fields terminated by ','
location '/user/me/DATEDIM';
一个 SELECT COUNT(*) 告诉我有很多行存在。查询时数据看起来不错。
我使用标准选择复制结果
INSERT INTO impala_kudu.DATEDIM
SELECT * FROM hdfs_datedim;
SELECT COUNT(*) 告诉我 impala_kudu.DATEDIM 有四行(HDFS 中的文件数不是表中的行数。
有任何想法吗?