7

我正在尝试在 HDFS 上为 Impala 上传 csv 文件,但多次失败。由于我已按照指南进行操作,因此不确定这里出了什么问题。并且 csv 也在 HDFS 上。

 CREATE EXTERNAL TABLE gc_imp 
                 (
                  asd INT,
                  full_name STRING,
                  sd_fd_date STRING,
                  ret INT,
                  ftyu INT,
                  qwerINT
                  ) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY','
LOCATION '/user/hadoop/Gc_4';

我得到的错误。我正在使用色调。

> TExecuteStatementResp(status=TStatus(errorCode=None,
> errorMessage='MetaException: hdfs://nameservice1/user/hadoop/Gc_4 is
> not a directory or unable to create one', sqlState='HY000',
> infoMessages=None, statusCode=3), operationHandle=None)

任何铅。

4

2 回答 2

9

/user/hadoop/Gc_4必须是目录。因此,您需要创建一个目录,例如/user/hadoop/Gc_4. 然后你上传你Gc_4的。所以文件路径是 /user/hadoop/Gc_4/Gc_4. 之后,您可以使用LOCATION指定目录路径/user/hadoop/Gc_4

LOCATION必须是目录。这个要求在 Hive 和 Impala 中是相同的。

于 2013-08-23T05:27:46.117 回答
1

这不是答案,而是一种解决方法。

在大多数情况下,我看到表已上传,但“状态”不成功。此外,如果您在 Hive 的帮助下存储了数据,这给了您更多控制权,那么“不要忘记刷新 Impala UI 上的元数据”。。很重要。

于 2013-08-23T16:47:22.557 回答