我正在尝试在配置单元中创建一个内部(托管)表来存储我的增量日志数据。表格是这样的:
CREATE TABLE logs (foo INT, bar STRING, created_date TIMESTAMP)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '<=>'
STORED AS TEXTFILE;
我需要定期将数据加载到此表中。
LOAD DATA INPATH '/user/foo/data/logs' INTO TABLE logs;
但是数据没有正确插入到表中。分隔符可能有问题。找不到原因。
示例日志行:
120<=>abcdefg<=>2016-01-01 12:14:11
在select * from logs;
我得到,
120 =>abcdefg NULL
第一个属性很好,第二个包含分隔符的一部分,但由于它是要插入的字符串,第三个属性为空,因为它需要日期时间。
任何人都可以帮助如何提供自定义分隔符并成功加载数据。