我想从我的 udf 调用中访问一个文件。这是我的脚本:
files = LOAD '$docs_in' USING PigStorage(';') AS (id, stopwords, id2, file);
buzz = FOREACH files GENERATE pigbuzz.Buzz(file, id) as file:bag{(year:chararray, word:chararray, count:long)};
jar 已注册。该路径对我的 hdfs 是真实的,文件确实存在于其中。呼叫完成。但似乎没有发现该文件。也许是因为我正在尝试访问 hdfs 上的文件。
如何从我的 UDF java 调用访问 hdfs 中的文件?