我在将数据从 pig 中获取到 CSV 中时遇到了很多麻烦,我可以在 Excel 或 SQL(或 R 或 SPSS 等)中使用而无需进行大量操作......
我试过使用以下功能:
STORE pig_object INTO '/Users/Name/Folder/pig_object.csv'
USING CSVExcelStorage(',','NO_MULTILINE','WINDOWS');
它使用该名称创建包含大量 part-m-0000# 文件的文件夹。稍后我可以使用 cat part* > filename.csv 将它们全部加入,但没有标题,这意味着我必须手动输入。
我读过 PigStorageSchema 应该创建另一个带有标题的位,但它似乎根本不起作用,例如,我得到的结果就像它只是存储一样,没有头文件:STORE pig_object INTO '/Users/名称/文件夹/pig_object' 使用 org.apache.pig.piggybank.storage.PigStorageSchema();
(我在本地和 mapreduce 模式下都试过了)。
有没有任何方法可以在没有这些多个步骤的情况下将 Pig 中的数据转换为简单的 CSV 文件?
任何帮助将非常感激!