1

当给定一个 pdf 文件(以及很可能是其他文件)时,JSoup 会下载整个文件,然后再查看内容类型并发现它无法解析它。

有什么方法可以阻止下载 pdf 文件本身,所以它在读取 http 标头后立即抛出“未处理的内容类型”异常?

我当前的代码如下所示:

        connection = Jsoup.connect(uri.toString());
        Document doc=connection.get();

我能想到的唯一解决方案是自己阅读标题,然后是用户 parseBodyFragment 但如果我还需要计算正确的字符集,这似乎需要做很多工作。

4

1 回答 1

1

是的,下载 1.6.4-Pending 解决了这个问题。

于 2012-07-24T06:29:25.210 回答