可能重复:
将 PDF 页面导出为 Java 中的一系列图像
请推荐一些可用于 PDF 文件到图像转换的好的 java 库。我尝试使用 PDFBox:http://pdfbox.apache.org/但在转换为图像后,我的 pdf 文件中的大部分文本在图像中都出现了乱码。它将“T”读作“Y”,将“C”读作“#”,依此类推。
以下是我用于相同的代码片段:
PDDocument document = null;
document = PDDocument.load( pdfFile );
List pages = document.getDocumentCatalog().getAllPages();
for( int i=startPage-1; i<endPage && i<pages.size(); i++ )
{
try
{
PDPage page = (PDPage)pages.get( i );
BufferedImage image = page.convertToImage();
}
}
document.close();
我想这是他们在渲染字体方面遇到的一些问题。如果您认为我在使用 PDFBox 时可能遗漏了什么,请告诉我。
请同时提出任何其他替代方案。
我尝试过使用 jPedal:http ://www.jpedal.org/效果很好,但它不是免费的,所以请就所有好的替代方案提出建议。