0

I am using hadoop to store files. I want to know the actual file size.

getFileSystem().getContentSummary(new Path(fileName)).getLength();

It returns the compressed file size. I am using default hadoop codec compression.

How can I compute the actual file size?

4

1 回答 1

1

除非压缩编解码器支持将未压缩的大小存储在压缩文件的页眉/页脚中,否则无法计算出未压缩的大小(除了执行流解压缩并通过 dd 之类的东西运行或计算 java 中的字节数)。

例如 GZip - 文件的最后 4 个字节是以字节为单位的未压缩大小(假设它不超过 4 个字节可以表示)

于 2013-04-19T15:31:14.337 回答