1

我正在使用CGPDFScanner从 PDF 中提取文本。

在调用我的TJ操作员回调时,当前字体的CIDSystemInfo->Registry值为“Adobe”和CIDSystemInfo->Ordering“Japan1”。即字符集“Adobe-Japan1”。

我如何使用这个事实将我用Tj运算符找到的所有文本转换为 unicode?

我敢肯定我在这里看不到树木的树木。

4

1 回答 1

0

您可以使用 Adob​​e 的 CMAP 文件将 Japan1 重新映射到 unicode。另请查看“补充”以获取正确的文件。

http://opensource.adobe.com/wiki/display/cmap/Downloads

于 2011-08-11T23:08:40.147 回答