1

我创建了一个带有管道分隔符的外部配置单元表。我所有的列都是字符串类型。文件中的一个值是一段文本。我无法理解的是为什么 Hive 会在没有管道的情况下终止此文本并将其放在下一列中。该段中有很多连续的空格。当 Hive 尝试读取文件时,这可能是一个问题。示例文本是:

'...SATA            Hooper Size  \= 6000...'.  

Hive 将直到 SATA 的部分放在 A 列中,将下一部分放在 B 列中。我认为每当空格太长时,它都会重复这一点。关于它为什么这样做以及如何解决这个问题的任何线索?如果有很多连续的空格,Hive 是否认为字符串已经结束?

4

1 回答 1

1

由于隐形字符,我曾经遇到过类似的问题。

1.下载数据到本地。

2.要么你应该有管道分隔符,要么你有一个换行符。

要确认,在 VI 中打开文件并检查(不可见)字符。

于 2013-08-01T08:48:14.760 回答