1

可能重复:
将 PDF 页面导出为 Java 中的一系列图像

请推荐一些可用于 PDF 文件到图像转换的好的 java 库。我尝试使用 PDFBox:http://pdfbox.apache.org/但在转换为图像后,我的 pdf 文件中的大部分文本在图像中都出现了乱码。它将“T”读作“Y”,将“C”读作“#”,依此类推。

以下是我用于相同的代码片段:

PDDocument document = null;  
document = PDDocument.load( pdfFile );  
List  pages = document.getDocumentCatalog().getAllPages();  
for( int i=startPage-1; i<endPage && i<pages.size(); i++ )  
{  
  try  
  {  
    PDPage page = (PDPage)pages.get( i );  
    BufferedImage  image = page.convertToImage();  
  }  
}  
document.close(); 

我想这是他们在渲染字体方面遇到的一些问题。如果您认为我在使用 PDFBox 时可能遗漏了什么,请告诉我。

请同时提出任何其他替代方案。

我尝试过使用 jPedal:http ://www.jpedal.org/效果很好,但它不是免费的,所以请就所有好的替代方案提出建议。

4

1 回答 1

-1

试试icePDF

于 2011-04-01T08:33:35.377 回答