0

损坏的转换图像 我尝试将 pdf 转换为图像文件......它工作正常,但它删除了其中一个矩形中的一条线......我不知道为什么......

public static void main(String[] args) throws FileNotFoundException, IOException
    {
        PDDocument doc = PDDocument.load(new FileInputStream(new File(".....pdf")));

    PDDocumentCatalog docCatalog = doc.getDocumentCatalog();
    List pages = docCatalog.getAllPages();

    for (Object pageObj : pages)
    {
        PDPage page = (PDPage) pageObj;
        BufferedImage pdfImage = page.convertToImage();
        ImageIO.write(pdfImage, "png", new File("/......png"));

    }
    doc.close();
}

在我删除 pdf 的所有文本之前....可能是它仍然在与文本宽度之一纠缠不清,然后覆盖矩形线?请在此处查看pdf...原始PDF

4

1 回答 1

1

当试图重现该问题时,事实证明当前的 PDFBox 1.7.1 正确呈现了图像。该问题仅在使用旧版本 0.7.3 时出现。

因此,如果使用 Maven,请使用

<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>1.7.1</version>
</dependency>

或此依赖项的更新版本,以防出现此类问题。

于 2013-02-19T13:02:35.830 回答