我需要找到一种在转换为 DOCX 文件期间忽略 PDF 文档中的图片和照片的方法。
我正在创建 FineReader Engine 的一个实例:
IEngine engine = Engine.InitializeEngine(
engineConfig.getDllFolder(), engineConfig.getCustomerProjectId(),
engineConfig.getLicensePath(), engineConfig.getLicensePassword(), "", "", false);
之后,我正在转换一个文档:
IFRDocument document = engine.CreateFRDocument();
document.AddImageFile(file.getAbsolutePath(), null, null);
document.Process(null);
String exportPath = FileUtil.prepareExportPath(file, resultFolder);
document.Export(exportPath, FileExportFormatEnum.FEF_DOCX, null);
结果,它转换了初始 pdf 文档中的所有图像。