有人知道如何在 Pig 中使用 ORCfiles 输入/输出吗?我在大象鸟中找到了对 RCFiles 的某种支持,但似乎不支持 ORC 格式...您能否提供一个使用 Pig 在 Pig 中访问/存储 ORC 文件的示例?
问问题
2546 次
2 回答
4
通过 Pig 对 ORC 存储的支持尚未承诺并正在积极开发中。请参阅 Apache JIRA PIG-3558。在此之后,您将能够像这样通过您的 Pig 脚本访问 ORC 文件
load 'foo.orc' using OrcStorage();
...
store .. using OrcStorage('-c SNAPPY');
于 2014-04-11T21:10:05.753 回答
0
使用存储为 ORC 的 HCat CLI 定义 HCatalog 表。然后使用 org.apache.hcatalog.pig.HCatLoader() 加载 pig 中的关系或使用 org.apache.hcatalog.pig.HCatStorer() 存储关系
于 2013-10-08T23:39:38.233 回答