在 Java 中,我希望能够读取 PDF 文件,测试它是否符合 PDF/A(用于存档的 PDF),如果不符合,则将文件转换为 PDF/A。
我可能更喜欢在 Apache PDFBox 中使用它,因为我已经在那个 API 中做了一些事情,但我也会对其他 API 开放。
可以使用 PDFBox 预检来测试 PDF 文件是否为 PDF/A-1b,请参见此处的示例或使用预检应用程序。
创建一个将文件从 PDF 转换为 PDF/A 的工具是一项艰巨的任务,可能需要数月甚至数年的时间。如果您查看 PDFBox 预检的源代码,您会发现数百条错误消息。因此,您的工具必须能够修复这些错误中的每一个。有些是:
只需使用 PDFBox 预检检查您自己的一些文件,您就会发现各种各样的问题......
如果您没有几个月或几年的时间,请访问Callas Software GmbH
或PDF Tools AG
购买此类转换器的主页。