Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用CGPDFScanner从 PDF 中提取文本。
CGPDFScanner
在调用我的TJ操作员回调时,当前字体的CIDSystemInfo->Registry值为“Adobe”和CIDSystemInfo->Ordering“Japan1”。即字符集“Adobe-Japan1”。
TJ
CIDSystemInfo->Registry
CIDSystemInfo->Ordering
我如何使用这个事实将我用Tj运算符找到的所有文本转换为 unicode?
Tj
我敢肯定我在这里看不到树木的树木。
您可以使用 Adobe 的 CMAP 文件将 Japan1 重新映射到 unicode。另请查看“补充”以获取正确的文件。
http://opensource.adobe.com/wiki/display/cmap/Downloads