1

我有一个HIVE使用JSON Serde. 我正在使用Shark发行版(http://shark.cs.berkeley.edu/)。定义如下:

CREATE TABLE lastfm(
artist string,
title string ,
track_id string,
similars array<array<string>>,
tags array<array<string>>
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'; 

我能够成功地将数据加载到该表中。现在,我ParquetHIVE.

CREATE TABLE lastfm_par (
  artist string,
  title string ,
    track_id string,
    similars array<array<string>>,
    tags array<array<string>>
)
ROW FORMAT SERDE 'parquet.hive.serde.ParquetHiveSerDe'
 STORED AS
 INPUTFORMAT 'parquet.hive.DeprecatedParquetInputFormat'
 OUTPUTFORMAT 'parquet.hive.DeprecatedParquetOutputFormat';

现在,我尝试使用以下命令将表中的数据加载到JSON Serde表中:Parquet

insert overwrite table lastfm_par select * from lastfm;

insert语句成功完成。但是当我查询Parquet表中的数据时,所有列都填充了NULL值。我在网上搜索了类似的问题,但还没有看到类似的东西。有人对这里出了什么问题有一些想法吗?

谢谢,维沙赫

4

0 回答 0