如何创建一个Scalding
Source
可以处理 和 之间avro
的转换parquet
。
解决方案应该:
1. Read from parquet format and convert to avro memory representation
2. Write avro objects into a parquet file
注意:我注意到 Cascading 有一个用于利用 thrift 和 parquet 的模块。我突然想到这将是一个开始寻找的好地方。我还在google-groups/scalding-dev上开了一个帖子