1

我正在使用下面的代码将 PDF 转换为 PNG 图像。

        Document document = new Document();
        try {
            document.setFile(myProjectPath);
            System.out.println("Parsed successfully...");
        } catch (PDFException ex) {
            System.out.println("Error parsing PDF document " + ex);
        } catch (PDFSecurityException ex) {
            System.out.println("Error encryption not supported " + ex);
        } catch (FileNotFoundException ex) {
            System.out.println("Error file not found " + ex);
        } catch (IOException ex) {
            System.out.println("Error handling PDF document " + ex);
        }

        // save page caputres to file.
        float scale = 1.0f;
        float rotation = 0f;

        // Paint each pages content to an image and write the image to file
        InputStream fis2 = null;
        File file = null;
        for (int i = 0; i < 1; i++) {
            BufferedImage image = (BufferedImage) document.getPageImage(i,
                    GraphicsRenderingHints.SCREEN,
                    Page.BOUNDARY_CROPBOX, rotation, scale);
            RenderedImage rendImage = image;
            // capture the page image to file
            try {
                System.out.println("\t capturing page " + i);
                file = new File(myProjectActualPath + "myImage.png");
                ImageIO.write(rendImage, "png", file);
                fis2 = new BufferedInputStream(new FileInputStream(myProjectActualPath + "myImage.png"));
            } catch (IOException ioe) {
                System.out.println("IOException :: " + ioe);
            } catch (Exception e) {
                System.out.println("Exception :: " + e);
            }
            image.flush();
        }

myProjectPath是pdf文件的路径。

问题是我有大小为 305 KB 的 pdf 图像。当我使用上面的代码转换图像时,图像大小为 5.5 MB,这是出乎意料的。为什么会发生这种情况?有没有办法压缩这个?如果我得到压缩大小的解决方案(通过缩小像素大小),也可以。

注意:对于其他 pdf 文件,图像将达到 305 KB。一个 PDF 文件会发生这种情况,但不确定为什么会发生这种情况。

编辑 1

我正在使用 jar 文件作为

icepdf-core.jar
icepdf-viewer.jar

我的进口是

import org.icepdf.core.exceptions.PDFException;
import org.icepdf.core.exceptions.PDFSecurityException;
import org.icepdf.core.pobjects.Document;
import org.icepdf.core.pobjects.Page;
import org.icepdf.core.util.GraphicsRenderingHints;
4

2 回答 2

0

您应该能够通过更改比例来更改文件的大小。PDF 通常比渲染图像小得多。它们可以表示渲染图像将使用大量字节来表示的文本和矢量图形。实际上,我对您的任何 png 都与 pdf 大小相同感到有些惊讶(除非 pdf 只是图片)。

于 2012-09-25T08:27:21.930 回答
0

您可以从 pdf 中提取图像(使用 PDFBox 的示例):

    List<PDPage> pages = document.getDocumentCatalog().getAllPages();
    for(PDPage page : pages) {
        Map<String, PDXObjectImage> images = page.getResources().getImages();

        for(PDXObjectImage image : images.values()){
            //TODO: write image to disk
        }   
    }

OR/AND 您可能希望将它们以 jpg 格式保存到磁盘,因为 jpg 比 png 更胜一筹。

你甚至可以通过调用来识别原始图像的格式并在写入磁盘时使用它:

image.getSuffix();
于 2012-09-25T08:46:39.897 回答