0

我正在阅读只需要前 5% 的大型文档,我可以使用 HttpClient 4 执行以下操作吗?

  1. 请求页面(获取或发布)
  2. 以流形式读取响应
  3. “即时”将其输入基于 SAX 的 HTML 解析器
  4. 当检测到某些 HTML 标记时 - 终止流

请注意 HttpClient v. 4 是必需的 - 我不能使用 v. 3

4

1 回答 1

0

感谢来自 HttpClient 邮件列表的 Ken,这是答案

使用返回
java.io.InputStream 的 HttpEntity#getContent() 方法,并将其传递给基于 SAX 的 HTML 解析器。

http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e122

当您看到所需的标记时,通过调用 HttpUriRequest#abort() 方法终止请求。

http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e285

于 2009-08-17T22:04:49.787 回答