6

为什么以下代码返回-1?似乎请求失败了。

public static void main(String[] args)
{
    DefaultHttpClient httpClient = new DefaultHttpClient();
    HttpGet httpGet = new HttpGet("http://www.google.de");

    HttpResponse response;
    try
    {
        response = httpClient.execute(httpGet);
        HttpEntity entity = response.getEntity();
        EntityUtils.consume(entity);

        // Prints -1
        System.out.println(entity.getContentLength());
    }
    catch (ClientProtocolException e)
    {
        e.printStackTrace();
    }
    catch (IOException e)
    {
        e.printStackTrace();
    }
    finally
    {
        httpGet.releaseConnection();
    }
}

是否有可能以字符串形式获得响应?

4

3 回答 3

7

尝试运行

Header[] headers = response.getAllHeaders();
for (Header header : headers) {
    System.out.println(header);
}

它会打印

Date: Tue, 10 Sep 2013 19:10:04 GMT
Expires: -1
Cache-Control: private, max-age=0
Content-Type: text/html; charset=ISO-8859-1
Set-Cookie: PREF=ID=dad7e2356ddb3b7a:FF=0:TM=1378840204:LM=1378840204:S=vQcLzVPbOOTxfvL4; expires=Thu, 10-Sep-2015 19:10:04 GMT; path=/; domain=.google.de
Set-Cookie: NID=67=S11HcqAV454IGRGMRo-AJpxAPxClJeRs4DRkAJQ5vI3YBh4anN3qS0EVeiYX_4XDTGN-mY86xTBoJ3Ncca7eNSdtGjcaG31pbCOuqsZEQMWwKn-7-6Dnizx395snehdA; expires=Wed, 12-Mar-2014 19:10:04 GMT; path=/; domain=.google.de; HttpOnly
P3P: CP="This is not a P3P policy! See http://www.google.com/support/accounts/bin/answer.py?hl=en&answer=151657 for more info."
Server: gws
X-XSS-Protection: 1; mode=block
X-Frame-Options: SAMEORIGIN
Alternate-Protocol: 80:quic
Transfer-Encoding: chunked

这不是问题,您请求的页面根本没有Content-Length在其响应中提供标题。因此,HttpEntity#getContentLength()回报-1.

EntityUtils有许多方法,其中一些返回 a String


curl最近运行会产生

> curl --head http://www.google.de
HTTP/1.1 200 OK
Date: Fri, 03 Apr 2020 15:38:18 GMT
Expires: -1
Cache-Control: private, max-age=0
Content-Type: text/html; charset=ISO-8859-1
P3P: CP="This is not a P3P policy! See g.co/p3phelp for more info."
Server: gws
X-XSS-Protection: 0
X-Frame-Options: SAMEORIGIN
Set-Cookie: 1P_JAR=2020-04-03-15; expires=Sun, 03-May-2020 15:38:18 GMT; path=/; domain=.google.de; Secure
Set-Cookie: NID=201=H8GdKY8_vE5Ehy6qSkmQru13HqdGEj2tvZUFqvTDAVBxFoL4POI0swPtfI45v1TBjrJuAAfbcNMUddniIf9HHituCAFwUqmUFMDwxDYK5qUlcWiB1A64OcGp6PTT6LKur2r_3z-ToSvLf8RZhKWdny6E8SaArMpkaOqUEWp4aoQ; expires=Sat, 03-Oct-2020 15:38:18 GMT; path=/; domain=.google.de; HttpOnly
Transfer-Encoding: chunked
Accept-Ranges: none
Vary: Accept-Encoding

标头包含 的Transfer-Encodingchunked。使用chunked,响应包含“块”,前面是它们的长度。HTTP 客户端使用这些来读取整个响应。

HTTP 规范规定,当标头的值为Content-Length时不应存在,如果存在则必须忽略。Transfer-Encodingchunked

于 2013-09-10T19:11:06.257 回答
4

请注意响应头名称 Transfer-Encoding。它的值是分块的,这意味着数据是逐块传递的。Transfer-Encoding: chunked 和 Content-Length 不会同时出现。有两个原因。

  1. 服务器不希望发送的内容长度。
  2. 或者服务器在刷新大于服务器缓冲区的大数据时不知道内容长度。

因此,当没有内容长度标头时,您可以在内容主体之前找到每个分块块的大小。例如:

HTTP/1.1 200 OK

Server: Apache-Coyote/1.1

Set-Cookie: JSESSIONID=8A7461DDA53B4C4DD0E89D73219CB5F8; Path=/

Content-Type: text/html;charset=UTF-8

Transfer-Encoding: chunked

Date: Wed, 18 Mar 2015 07:10:05 GMT

11

helloworld!

3

123

0

上面的 headers 和 content 告诉我们,有两个块数据。第一个块的大小是 11。第二个块的大小是 3。所以内容长度是 14。

问候,西慈

于 2015-03-19T03:09:35.690 回答
1

如果你真的想在不关心内容的情况下获取内容长度,你可以这样做。

EntityUtils.toByteArray(httpResponse.getEntity()).length

于 2013-11-08T22:34:09.627 回答