1

我决定不使用hadoop-lzo索引我的 LZO 输入文件,而是将其简单地拆分为一个块,使用 LZO 压缩的块将接近 128MB(因为它是Amazon Distribution [1]上的默认块大小)。

提供已经拆分并压缩到接近默认 HDFS 块大小的输入是否有任何问题(从集群性能的角度来看)?

4

0 回答 0