1

我编写了一个简单的 java 程序来获取 PDF 文档的页码。这适用于我的大多数文档,但不适用于以下文档:

http://web.itu.edu.tr/~pazarci/rtv/TEK_Digital%20Video%20Measurements_25W_14700_3.pdf

代码片段如下:

    document = PDDocument.load(docPath);
    System.out.println( docPath + ": " + document.getNumberOfPages() + " pages");

其中 docPath 指向该文档的本地路径。

然后程序在这里停止。它不会退出,也不会打印任何错误消息。它只是在 PDDocument.load() 处停止并且不会继续。

4

1 回答 1

2

我遇到了同样的问题,所以我使用您提到的 PDF 向 PDFBox 工作人员提出了一个问题。它位于https://issues.apache.org/jira/browse/PDFBOX-1726

他们建议我使用PDDocument.loadNoSeq()而不是PDDocument.load(). 它对我有用!

试试这个,让我们知道!

于 2013-09-24T19:00:27.297 回答