0

我需要读入一个字典文件来过滤 中指定的内容hdfs_input,并且我已经使用命令将它上传到集群put,但我不知道如何在我的程序中访问它。

我尝试像普通文件一样使用集群上的路径访问它,但它给出了错误信息:IOError:[Errno 2] No such file or directory

此外,有没有办法为所有运行该作业的机器只保留一份字典?

那么除了inputhadoop作业中指定的文件之外,访问文件的正确方法是什么?

4

1 回答 1

0

通过在 conf 文件中添加-file选项或选项所需的文件解决了问题。file=

于 2012-06-19T09:20:42.010 回答