我正在阅读只需要前 5% 的大型文档,我可以使用 HttpClient 4 执行以下操作吗?
- 请求页面(获取或发布)
- 以流形式读取响应
- “即时”将其输入基于 SAX 的 HTML 解析器
- 当检测到某些 HTML 标记时 - 终止流
请注意 HttpClient v. 4 是必需的 - 我不能使用 v. 3
我正在阅读只需要前 5% 的大型文档,我可以使用 HttpClient 4 执行以下操作吗?
请注意 HttpClient v. 4 是必需的 - 我不能使用 v. 3
感谢来自 HttpClient 邮件列表的 Ken,这是答案
使用返回
java.io.InputStream 的 HttpEntity#getContent() 方法,并将其传递给基于 SAX 的 HTML 解析器。http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e122
当您看到所需的标记时,通过调用 HttpUriRequest#abort() 方法终止请求。
http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e285