我正在探索将 PDF 文档转换为 PDF/A 的工具。Ghostscript 似乎为这种转换提供了开箱即用的支持。一个问题似乎是作为原始 PDF 文档一部分的某些真字体没有正确转换。如果我从转换后的 PDF/A 文档中复制文本并将其粘贴到记事本中,则复制的文本似乎是乱码。
原始文档文本可以复制到记事本就好了。
我正在使用以下脚本:
gswin64 -dPDFA -dBATCH -dNOPAUSE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=FilteredOutput.pdf Filtered1Page.pdf
我在 Google Drive 中上传了一个示例 1 页源 PDF: SampleInput
从该命令生成的示例输出 PDF/A 文档位于 Google 驱动器中: SampleOutput
在 Windows 机器上对此 PDF 运行上述查询将重现该问题。
是否有任何设置/命令可以正确处理 PDF/A 转换?