0

我有一个输入流,我试图处理它,但它给了我这个错误“不是 gzip 格式”,但文件是 gzip 格式“内容编码:gzip”

protected String readResponse(InputStream is) throws IOException {
StringBuffer string;
int b;
byte[] buffer;
String eol, s = null;
GZIPInputStream gis;
int read;
int index;


eol = new String(new byte[] {(byte)0, (byte)0, (byte)-1, (byte)-1});
buffer = new byte[1];
string = new StringBuffer();
while ( (b = is.read()) > 0 ) {
  buffer[0] = (byte)b;
  s = new String(buffer);
  string.append(s);
  index = string.indexOf(eol);
  if ( index > 0 && index == string.length() - 4 ) {
    break;
  }

}

System.out.println(string);

gis = new GZIPInputStream(is); << here I got the error
buffer = new byte[1024]; 

while ( (read = gis.read(buffer)) > 0 ) {
  string.append(new String(buffer, 0, read));
}
return string.toString();

}

有什么想法吗?谢谢

4

4 回答 4

1

看到这一行:

eol = new String(new byte[] {(byte)0, (byte)0, (byte)-1, (byte)-1});

足以得出一个结论:你从一开始就注定要失败。

不要将字符串用于二进制数据

bytes 和chars 彼此没有关系;您在这里所做的大致相当于以下内容:

final CharsetDecoder decoder = Charset.defaultCharset()
    .newDecoder().onMalformedInput(CodingErrorAction.REPLACE);
final ByteBuffer buf = ByteBuffer.wrap(new byte[]{...});
final CharBuffer cbuf = decoder.decode(buf);
final String eol = new String(cbuf.array());

注意REPLACE动作。任何不可映射的字节序列都会触发解码器输出 Unicode 替换字符U+FFFD(看起来很熟悉,对吗?)。

现在尝试REPORT代替。

更重要的是,您使用默认字符集......这因平台而异。

您的代码实际上应该只读取输入流并返回一个byte数组。使用ByteArrayOutputStream.

如果你想直接写入文件,很简单:使用Files.copy().

无论如何,为您解决了这个问题:

// Note: return code is byte[]
protected byte[] readResponse(final InputStream in)
    throws IOException
{
    try (
        final InputStream gzin = new GzipInputSream(in);
        final ByteArrayOutputStream out = new ByteArrayOutputStream();
    ) {
        final byte[] buf = new byte[4096];
        int bytesRead;
        while ((bytesRead = gzin.read(buf)) != -1)
            out.write(buf, 0, bytesRead);

        return out.toByteArray();
    }
}
于 2015-01-23T07:02:49.143 回答
0

您的代码中有很多错误......但是让我们尝试一下。所以你有 ascii 标头,然后应该有 gzipped 部分?Gzip 文件总是以 id 字节开头。这些具有固定值“ID1 = 31 (0x1f, \037), ID2 = 139 (0x8b, \213)”。你能从你的输入流中找到那些吗?在那里你应该启动 gzipstream。

于 2015-01-23T17:54:08.343 回答
0

问题可能是您在将输入流中的文件指针传递给 GZIPInputStream 之前将其推进。GZIPInputStream 期望前几个字节是标准头。

尝试移动 new GZIPInputStream(is); 在你的 while 循环之前

于 2015-01-23T06:54:40.210 回答
0

我已经用一个由几个标题行组成的文件进行了测试,然后是一个空行,以及一个附加的 gzip 压缩文本文件。后者被写入,未扩展,到 x.gz 并解压缩并从那里读取,假设它是一个文本文件。(如果是二进制文件,BufferedReader 是没有意义的。)

应该添加尝试/使用资源和捕获,但这只是技术性的。

InputStream is = ...;
StringBuilder lsb = new StringBuilder();
int c = -1;
while( (c = is.read()) != -1 ){
    if( c == '\n' ){
        String line = lsb.toString();
        if( line.matches( "\\s*" ) ){
            break;
        }
        System.out.println( line );
        lsb.delete( 0, lsb.length() );
    } else {
        lsb.append( (char)c );
    }
}
byte[] buffer = new byte[1024];
int nRead = 0;
OutputStream os = new FileOutputStream( "x.gz" );
while ( (nRead = is.read(buffer, 0, buffer.length )) > 0 ) {
    os.write( buffer, 0, nRead );
}
os.close();
is.close();

InputStream gis = new GZIPInputStream( new FileInputStream( "x.gz" ) );
InputStreamReader isr = new InputStreamReader( gis );
BufferedReader br = new BufferedReader(isr);
String line;
while( (line = br.readLine()) != null ){
    System.out.println("line: " + line );
}
br.close();
于 2015-01-24T10:50:09.047 回答