我正在尝试将 CSV 文件加载到 Hive 表中,如下所示:
CREATE TABLE mytable
(
num1 INT,
text1 STRING,
num2 INT,
text2 STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ",";
LOAD DATA LOCAL INPATH '/data.csv'
OVERWRITE INTO TABLE mytable;
csv 由逗号 (,) 分隔,如下所示:
1, "some text, with comma in it", 123, "more text"
这将返回损坏的数据,因为第一个字符串中有一个“,”。
有没有办法设置文本分隔符或让 Hive 忽略字符串中的“,”?
我无法更改 csv 的分隔符,因为它是从外部源中提取的。