我目前正在尝试让 HttpComponents 发送 HttpRequests 并检索响应。在大多数 URL 上,这都没有问题,但是当我尝试获取 phpBB 论坛的 URL 时,即http://www.forum.animenokami.com客户端需要更多时间,并且 responseEntity 包含不止一次的段落导致损坏.html 文件。
例如,元标记包含六次。由于许多其他 URL 有效,我无法弄清楚我做错了什么。该页面在已知浏览器中正常工作,因此这不是他们方面的问题。
这是我用来发送和接收的代码。
URI uri1 = new URI("http://www.forum.animenokami.com");
HttpGet get = new HttpGet(uri1);
get.setHeader(new BasicHeader("User-Agent", "Mozilla/5.0 (Windows NT 5.1; rv:6.0) Gecko/20100101 Firefox/6.0"));
HttpClient httpClient = new DefaultHttpClient();
HttpResponse response = httpClient.execute(get);
HttpEntity ent = response.getEntity();
InputStream is = ent.getContent();
BufferedInputStream bis = new BufferedInputStream(is);
byte[] tmp = new byte[2048];
int l;
String ret = "";
while ((l = bis.read(tmp)) != -1){
ret += new String(tmp);
}
我希望你能帮助我。如果您需要更多信息,我会尽快提供。