我收到以下异常:
java.io.FileNotFoundException: File does not exist: /log1/20131025/2013102509_at1.1382659200021.tmp
at org.apache.hadoop.hdfs.DFSClient$DFSInputStream.fetchLocatedBlocks(DFSClient.java:2006)
at org.apache.hadoop.hdfs.DFSClient$DFSInputStream.openInfo(DFSClient.java:1975)
...
在 MR 作业运行时。Flume 将文件名从xxx.tmp
to更改xxx.
为 MR 任务找不到文件(MR 正在尝试读取xxx.tmp
)并抛出错误。
我不知道如何避免 FileNotFoundException。
我正在通过 Hadoop 流 ( $hadoop jar contrib/streaming/hadoop-streaming-1.2.1.jar...
)运行 MR 作业
有排除 xxx.tmp 文件的选项吗?