当给定一个 pdf 文件(以及很可能是其他文件)时,JSoup 会下载整个文件,然后再查看内容类型并发现它无法解析它。
有什么方法可以阻止下载 pdf 文件本身,所以它在读取 http 标头后立即抛出“未处理的内容类型”异常?
我当前的代码如下所示:
connection = Jsoup.connect(uri.toString());
Document doc=connection.get();
我能想到的唯一解决方案是自己阅读标题,然后是用户 parseBodyFragment 但如果我还需要计算正确的字符集,这似乎需要做很多工作。