3

在 Java 中,我希望能够读取 PDF 文件,测试它是否符合 PDF/A(用于存档的 PDF),如果不符合,则将文件转换为 PDF/A。

我可能更喜欢在 Apache PDFBox 中使用它,因为我已经在那个 API 中做了一些事情,但我也会对其他 API 开放。

4

1 回答 1

4

可以使用 PDFBox 预检来测试 PDF 文件是否为 PDF/A-1b,请参见此处的示例或使用预检应用程序。

创建一个将文件从 PDF 转换为 PDF/A 的工具是一项艰巨的任务,可能需要数月甚至数年的时间。如果您查看 PDFBox 预检的源代码,您会发现数百条错误消息。因此,您的工具必​​须能够修复这些错误中的每一个。有些是:

  • 非嵌入字体
  • 在没有输出意图的情况下使用颜色
  • 不正确的元数据
  • JBIG2 编码图像
  • LZW 编码数据

只需使用 PDFBox 预检检查您自己的一些文件,您就会发现各种各样的问题......

如果您没有几个月或几年的时间,请访问Callas Software GmbHPDF Tools AG购买此类转换器的主页。

于 2016-08-03T08:40:53.513 回答