我正在使用 HttpClient 4.1 下载网页。我想得到一个压缩版本:
HttpGet request = new HttpGet(url);
request.addHeader("Accept-Encoding", "gzip,deflate");
HttpResponse response = httpClient.execute(request,localContext);
HttpEntity entity = response.getEntity();
response.getFirstHeader("Content-Encoding")
"Content-Encoding: gzip"
然而,显示entity.getContentEncoding()
的是null
.
如果我放:
entity = new GzipDecompressingEntity(entity);
我得到:
java.io.IOException: Not in GZIP format
看起来生成的页面是纯文本并且未压缩,即使“Content-Encoding”标头显示它是 gzip 压缩的。
我已经在几个 URL(来自不同的网站)上尝试过这个,但得到了相同的结果。
如何获得网页的压缩版本?