在解析 pdf 文件时,我遇到了一个预定义的 CMap(UniCNS-UTF16-H,你可以在这里找到它http://sourceforge.net/projects/cmap.adobe/files/cmapresources_cns1-6.tar.z/download)。当我查看它时,我发现单个 CID 可以引用到多个 unicode 中。
我的问题是,这样做的目的是什么?我怎么知道我应该将我的角色映射到哪个 unicode ?
cid2code.txt 文件的标题说“可能存在单个 CID 在单个 CMap 文件中的多个编码点中引用的情况。这些情况在同一列中以逗号分隔。” 但它没有说明原因。
我查看了技术说明 #5080“Adobe-CNS1-6 Character Collection for CID-Keyed Fonts”,但没有找到答案。因此,如果有人能指出解释这一点的段落以及如何处理它,我将不胜感激。