java - org.apache.pdfbox.pdmodel.PDDocument 不加载/读取 PDF 文档

Question

我编写了一个简单的 java 程序来获取 PDF 文档的页码。这适用于我的大多数文档，但不适用于以下文档：

代码片段如下：

    document = PDDocument.load(docPath);
    System.out.println( docPath + ": " + document.getNumberOfPages() + " pages");

其中 docPath 指向该文档的本地路径。

然后程序在这里停止。它不会退出，也不会打印任何错误消息。它只是在 PDDocument.load() 处停止并且不会继续。

score 2 · Accepted Answer

我遇到了同样的问题，所以我使用您提到的 PDF 向 PDFBox 工作人员提出了一个问题。它位于https://issues.apache.org/jira/browse/PDFBOX-1726。

他们建议我使用PDDocument.loadNoSeq()而不是PDDocument.load(). 它对我有用！

试试这个，让我们知道！

1 回答 1