我有几个有问题的 PDF,我正在尝试将其转换为 PDF/A-1a。
这些文档使用 CID Identity-H 嵌入式子集,由 Acrobat Distiller 20.0 生成。我已经搜索了可以利用 OCR 扫描渲染输出的工具,目的是自动生成丢失的 ToUnicode CMap,或者至少为用户选择提供高概率的候选者,但在这方面没有成功。
字形清晰易读。如果这不是为这些文件构建 ToUnicode CMaps 的首选方法,是否有用于构建代码点的通用可视实用程序(或方法)?我尝试将字体提取到 FontForge 中,但失败了(FontForge 输出表明 PDF 不可读)。
谢谢!