2

我们有两个集群,我们的要求是将数据从一个集群拉到另一个集群。

我们唯一可用的选择是,通过 webhdfs 提取数据!!

但不幸的是,我们可以看到,通过 webhdfs,我们一次只能拉取一个文件,这也需要为每个文件执行两个命令。

我的直接问题是:有没有办法通过 webhdfs,我们可以提取整个目录数据?

**Ex:** 
**directory structure in the cluster:**

dir1

        file1

        file2

        file3 


**currently observed that,** 

for every file i.e 1,2 & 3, i need to execute two commands to get data.

**Problem statement:** 

Is there a way thru webhdfs, to get all the files in a single call i.e., files 1,2 & 3 at a time from dir1 ...!!!!

有人可以帮我解决这个...

注意:由于安全原因,DISTCP 对我们来说不是一个可行的选择!!

4

0 回答 0