我无法简单地加载数据进行测试和分析。我在用着
https://www.reddit.com/r/datasets/comments/3oiv9z/reddit_september_comment_archive_is_now_available/
在使用从该文件中仅获取 10000 行之后,我尝试将它们加载到猪中。
甚至像这样简单的返回错误。
REGISTER '/user/cloudera/json-simple-1.1.1.jar'
REGISTER '/user/cloudera/elephant-bird-pig-4.1.jar'
REGISTER '/user/cloudera/elephant-bird-hadoop-compat-4.1.jar'
a = LOAD '/user/cloudera/top' USING com.twitter.elephantbird.pig.load.JsonLoader() as (json:map[]);
错误代码:
主类[org.apache.oozie.action.hadoop.PigMain],退出代码[2]