ios - CGPDFScanner 和 Adobe-Japan1

Question

我正在使用CGPDFScanner从 PDF 中提取文本。

在调用我的TJ操作员回调时，当前字体的CIDSystemInfo->Registry值为“Adobe”和CIDSystemInfo->Ordering“Japan1”。即字符集“Adobe-Japan1”。

我如何使用这个事实将我用Tj运算符找到的所有文本转换为 unicode？

我敢肯定我在这里看不到树木的树木。

score 0 · Accepted Answer

您可以使用 Adobe 的 CMAP 文件将 Japan1 重新映射到 unicode。另请查看“补充”以获取正确的文件。

ios - CGPDFScanner 和 Adob​​e-Japan1