4

我的查询是:

CREATE EXTERNAL TABLE gateway_staging (
  poll int,
  total int,
  transaction_id int,
  create_time timestamp,
  update_time timestamp
  )
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '^P';

(我不确定 '^P' 是否可以用作分隔符,但试过了)

当我将数据加载到配置单元表时,结果显示所有字段“无”。

数据如下:

4307421698^P200^P138193920770^P2017-03-08 02:46:18.021204^P2017-03-08 02:46:18.021204

请帮帮我。

4

2 回答 2

2

以下是选项:

  • ... fields terminated by '\020'(八进制)
  • ... fields terminated by '16'(十进制)
  • ... fields terminated by '\u0010'(十六进制)

请注意,存在一个与 Unicode 文字 ('\u0010') 相关的错误,假设在 2.1 版中已修复,因此使用第 3 个选项在早期版本中不起作用。 https://issues.apache.org/jira/browse/HIVE-13434

于 2017-03-12T18:25:36.727 回答
0

^P的八进制值为020。尝试,

CREATE EXTERNAL TABLE gateway_staging (
  poll int,
  total int,
  transaction_id int,
  create_time timestamp,
  update_time timestamp
  )
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '\020';
于 2017-03-12T18:20:15.370 回答