我能够通过 spark csv 读取 .gz 文件并获得预期的结果。但是,在尝试读取 .zip 文件时,spark 会给出意想不到的结果,例如 wV�J�.f�T n。
我访问过“ https://github.com/apache/hadoop/tree/trunk/hadoop-common-project/hadoop-common/src/main/java/org/apache/hadoop/io/compress ”,但没有找不到 .zip 文件的任何压缩编解码器。
我在stackoverflow上进行了搜索,但没有得到任何令人满意的结果。
如果有人遇到同样的问题或对此有任何解决方案,请提供更多信息。