2

我正在尝试使用配置单元流作业将数据插入到包含具有 MAP 数据类型的列的表中。

我尝试在表定义中设置所有分隔符,然后以正确的格式从流式作业中输出数据。

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
COLLECTION ITEMS TERMINATED BY ','
MAP KEYS TERMINATED BY '|'
LINES TERMINATED BY '\n'

我还尝试以 Hive 存储地图的确切格式输出数据({key:value})

这是我一直看到的错误:

FAILED: Error in semantic analysis: Line 7:23 Cannot insert into target table because column number/types are different 'table_name': Cannot convert column 2 from string to map<string,string>.

是否可以在 Hive 中执行此操作?

4

1 回答 1

0

没有您的数据样本和完整的表模式,我无法为您解释错误原因。

显然根据您的 ROW FORMAT 定义;数据中的地图结构应该是(假设地图大小为 2):

....\tkey1|value2,key2|value2\t...other columns\n

于 2014-01-27T12:37:13.257 回答