pdf - 生成 ToUnicode CMap（以编程方式或可视方式）

问问题 2020-04-15T04:14:37.803

107 次

我有几个有问题的 PDF，我正在尝试将其转换为 PDF/A-1a。

这些文档使用 CID Identity-H 嵌入式子集，由 Acrobat Distiller 20.0 生成。我已经搜索了可以利用 OCR 扫描渲染输出的工具，目的是自动生成丢失的 ToUnicode CMap，或者至少为用户选择提供高概率的候选者，但在这方面没有成功。

字形清晰易读。如果这不是为这些文件构建 ToUnicode CMaps 的首选方法，是否有用于构建代码点的通用可视实用程序（或方法）？我尝试将字体提取到 FontForge 中，但失败了（FontForge 输出表明 PDF 不可读）。

谢谢！

0 回答 0