2

我正在编写一个简单的 Java http 服务器来响应 JSON 数据。我正在尝试在发送数据之前对数据进行 GZip,但它通常会发回 gzip 后的数据,从而在浏览器中产生错误。例如,在 Firefox 中它说:

内容编码错误 您尝试查看的页面无法显示,因为它使用了无效或不受支持的压缩形式。

有时,如果我正在压缩的字符串很小而没有某些字符,它会起作用,但是当有括号等时它似乎会混乱。特别是,我下面的示例文本失败了。

这是某种字符编码问题吗?我已经尝试了各种各样的东西,但它就是不想轻易工作。

String text;            
private Socket server;
DataInputStream in = new DataInputStream(server.getInputStream());
PrintStream out = new PrintStream(server.getOutputStream());

while ((text = in.readLine()) != null) {
    // ... process header info
    if (text.length() == 0) break;
}

out.println("HTTP/1.1 200 OK");
out.println("Content-Encoding: gzip");
out.println("Content-Type: text/html");
out.println("Connection: close");


// x is the text to compress
String x = "jsonp1330xxxxx462022184([[";
ByteArrayOutputStream outZip = new ByteArrayOutputStream();
GZIPOutputStream gzip = new GZIPOutputStream(outZip);

byte[] b = x.getBytes(); // Changing character encodings here makes no difference

gzip.write(b);
gzip.finish();
gzip.close();
outZip.close();
out.println();
out.print(outZip);
server.close();
4

2 回答 2

2

更新:这不再是正确的答案,请参阅上面@amichair 的答案。

与直觉相反,我认为 GZIPOutputStream 不适合流式传输。试试这个:

...
out.println("Content-Encoding: deflate");  // NOTICE deflate encoding
out.println("Content-Type: text/html");
out.println("Connection: close");
out.println();
String x = "jsonp1330xxxxx462022184([[";
DeflaterInputStream dis = new DeflaterInputStream(out);
dis.write(x.getBytes("utf-8"));   // JSON is UTF-8
dis.close();
server.close(); //  this a bad idea, the client may not have read the data yet
于 2012-02-29T07:51:53.210 回答
1

接受的答案不正确。

GZIPOutputStream确实可以用来实现gzipHTTP中的内容编码。事实上,这正是我在JLHTTP轻量级 HTTP 服务器中实现它的方式。对deflate内容编码的支持是相同的,只是用DeflaterOutputStreamused 代替。上面代码的问题只是它有问题:-)

  • 所有println语句(包括底部的语句)都应替换为字符串末尾的print和显式。\r\n这是因为 by 打印的换行符println是平台相关的,因此例如在 Linux 上它只会打印 a \n,而 HTTP 需要完整的 CRLF ( \r\n)。

  • out.print(outZip)基本上调用outZip.toString()并将其打印到流中。但是,outZip包含压缩的二进制数据,因此将其转换为字符串(使用任意平台默认编码,不少于),很可能会损坏数据。

  • 代码获取字符串,将其转换为字节,压缩它们,将它们转换回字符串,将它们转换回字节并将它们写出。相反,它只需要将字符串转换为字节,压缩它们并将它们写出来。您也不需要ByteArrayOutputStreamGZIPOutputStream可以直接包装底层输出流。只是不要忘记在标题(和尾随 CRLF)之后刷新打印流,然后才从正文的压缩流开始。

  • 关闭资源应该在 finally 或 try-with-resources 块中完成,并且使用正确的顺序和时间。

  • 在此示例中,连接在流结束时关闭,这很好。但一般来说,如果您想保持连接处于活动状态并流式传输未知长度的潜在大数据(您事先不知道压缩大小),您还需要实现chunked传输编码(这很简单)。

修复代码后,GZIPOutputStream就像一个魅力。

然而,虽然非常适合教育目的,但请注意这不是HTTP 服务器,即使已修复。您可以进一步阅读 RFC 2616 或 7230 以了解 HTTP 还需要做什么……但为什么要重新发明呢?有一堆轻量级的可嵌入 HTTP 服务器,您可以使用它们轻松完成工作,其中包括JLHTTP

于 2018-06-07T10:50:52.147 回答