我正在使用 Hadoop 0.20.2 并希望尽可能使用 -cat shell 命令将两个文件连接为一个(来源:http ://hadoop.apache.org/common/docs/r0.19.2/hdfs_shell.html )
这是我提交的命令(名称已更改):
**/path/path/path/hadoop-0.20.2> bin/hadoop fs -cat /user/username/folder/csv1.csv /user/username/folder/csv2.csv > /user/username/folder/outputdirectory/**
它返回 bash: /user/username/folder/outputdirectory/: No such file or directory
我还尝试创建该目录,然后再次运行它——我仍然收到“没有这样的文件或目录”错误。
我还尝试使用 -cp 命令将两者复制到一个新文件夹中,并使用 -getmerge 将它们组合起来,但 getmerge 也没有运气。
在 hadoop 中这样做的原因是文件很大,并且需要很长时间才能在 hadoop 之外下载、合并和重新上传。