jsoup - jsoup 在它给我“未处理的内容类型”之前下载整个文件

Question

当给定一个 pdf 文件（以及很可能是其他文件）时，JSoup 会下载整个文件，然后再查看内容类型并发现它无法解析它。

有什么方法可以阻止下载 pdf 文件本身，所以它在读取 http 标头后立即抛出“未处理的内容类型”异常？

我当前的代码如下所示：

        connection = Jsoup.connect(uri.toString());
        Document doc=connection.get();

我能想到的唯一解决方案是自己阅读标题，然后是用户 parseBodyFragment 但如果我还需要计算正确的字符集，这似乎需要做很多工作。

score 1 · Accepted Answer

1

是的，下载 1.6.4-Pending 解决了这个问题。

于 2012-07-24T06:29:25.210 回答

1 回答 1