我正在寻找具有这些功能的可靠(防挂起)方式来获取 Java 中的 HTTP 页面:
- 如果标题中的内容类型不是文本/...,则停止获取页面
- 如果加载的数据超过字节限制(并且未设置内容长度作为响应),您可以随时停止获取页面
- 您可以在给定的时间限制内停止获取页面
apache http 客户端有这些选项吗?我知道在多次连接之后,所有的一小部分完全挂起很长时间,甚至对进程信号也没有响应 - 但是这个问题可以在其他线程中运行页面获取时被忽略,你可以在一段时间后忘记. 但是我仍然没有找到给定问题的解决方案。
此外,我的目标是避免大量被遗忘的僵尸线程下载大文件,因此停止错误下载是这里的首要任务。