1

我必须将某个数据块从一个 hadoop 集群复制到另一个集群。我写了一个 hive 查询,将数据转储到 hdfs 中。将文件复制到目标集群后,我尝试使用命令“load data inpath '/a.txt' into table data”加载数据。我收到以下错误消息

失败并出现异常错误的文件格式。请检查文件的格式。失败:执行错误,从 org.apache.hadoop.hive.ql.exec.MoveTask 返回代码 1

我已将数据转储为序列文件。任何人都可以让我知道我在这里想念什么吗?

4

1 回答 1

2

STORED AS SEQUENCEFILE如果要将序列文件存储在表中,则应在创建表时使用。你已经写过你已经转储了数据,Sequence file但是你的文件名是a.txt. 我没明白。

如果您想将文本文件加载到需要序列文件作为数据源的表中,您可以做一件事。首先创建一个普通表并将文本文件加载到该表中。然后做 :

insert into table seq_table select * from text_table;
于 2013-06-28T21:51:41.890 回答