Apache Pig可以使用 PiggyBank 从 Hadoop 序列文件中加载数据SequenceFileLoader
:
REGISTER /home/hadoop/pig/contrib/piggybank/java/piggybank.jar;
DEFINE SequenceFileLoader org.apache.pig.piggybank.storage.SequenceFileLoader();
log = LOAD '/data/logs' USING SequenceFileLoader AS (...)
是否还有一个允许从 Pig 写入 Hadoop 序列文件的库?