我有一个HIVE
使用JSON Serde
. 我正在使用Shark
发行版(http://shark.cs.berkeley.edu/)。定义如下:
CREATE TABLE lastfm(
artist string,
title string ,
track_id string,
similars array<array<string>>,
tags array<array<string>>
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe';
我能够成功地将数据加载到该表中。现在,我Parquet
在HIVE
.
CREATE TABLE lastfm_par (
artist string,
title string ,
track_id string,
similars array<array<string>>,
tags array<array<string>>
)
ROW FORMAT SERDE 'parquet.hive.serde.ParquetHiveSerDe'
STORED AS
INPUTFORMAT 'parquet.hive.DeprecatedParquetInputFormat'
OUTPUTFORMAT 'parquet.hive.DeprecatedParquetOutputFormat';
现在,我尝试使用以下命令将表中的数据加载到JSON Serde
表中:Parquet
insert overwrite table lastfm_par select * from lastfm;
insert
语句成功完成。但是当我查询Parquet
表中的数据时,所有列都填充了NULL
值。我在网上搜索了类似的问题,但还没有看到类似的东西。有人对这里出了什么问题有一些想法吗?
谢谢,维沙赫