.gz 文件由名为 gzputs & gzwrite 的 C 程序编写。
我按 列出压缩文件内容gzip -l
,发现uncompressed
值不正确。该值似乎等于最新gzputs
或gzwrite
写入 .gz 文件的字节数。这使得ratio
nagitive 价值。
当这些 .gz 文件用作 Map/Reduce 的输入时发生错误。在地图阶段似乎只能读取 .gz 文件的一部分。(零件的大小似乎等于上述uncompressed
值)。
有人可以教我在 C 程序或 Map/Reduce 中应该做什么?