我尝试使用以下命令使用 Pig 和命令加载 CSV 文件:
A = LOAD '/USER/XYZ/PIG/FILENAME.ASC' USING PIGSTORAGE(',');
虽然它加载并没有给出错误,但cat a
给了我一个Directory does not exist error
. 我是 Pig 的新手,知道我在那里做错了什么。如何检查它是否确实已加载?还是加载了一个用词不当,文件只存在于 HDFS 上?
接下来,我想从 CSV 文件中剪切几列数据并将其存储在另一个文件中。我该怎么办?
我不一定需要脚本/代码,但如果你能指出正确的功能来完成我想做的事情,那就太好了。谢谢!