0

我正在尝试使用 PDFBox 提取 PDF 文件中的所有图像。它适用于包含 jpeg 和 png 图像的 pdf。但它不适用于 OpenJPEG2000 图像。我收到以下异常:收到以下错误:

org.apache.pdfbox.contentstream.PDFStreamEngine operatorException
SEVERE: Cannot read JPEG2000 image: Java Advanced Imaging (JAI) Image I/O Tools are not installed

在所有版本的 PDFBox 中,都会出现同样的异常。也尝试使用独立的 jar。

我也在 pom.xml 中包含了必要的依赖项。

<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>jbig2-imageio</artifactId>
</dependency>
<!-- For legal reasons (incompatible license), these two dependencies
are to be used only in the tests and may not be distributed. -->
<dependency>
<groupId>com.github.jai-imageio</groupId>
<artifactId>jai-imageio-core</artifactId>
</dependency>
<dependency>
<groupId>com.github.jai-imageio</groupId>
<artifactId>jai-imageio-jpeg2000</artifactId>
</dependency>

任何帮助将不胜感激。

4

1 回答 1

1

将映像相关的 .jar 文件复制到 lib 子目录中,然后使用此命令行:

java -cp "pdfbox-app-2.0.21.jar;lib/*" org.apache.pdfbox.tools.PDFBox ExtractImages <parameters>

利用 ”;” 在 Windows 上,":" 在 Linux 上。

org.apache.pdfbox.tools.PDFBox是主类的名称。

于 2020-10-13T07:49:27.187 回答