我正在处理 PDF 文件,并希望尽可能将字符转换为 Unicode。MathematicalPI 系列字符集似乎使用它们自己的符号名称(例如“H11001”)。通过探索,我构建了一个表(用于 MathematicalPI-One),例如:
<chars>
<char charname="H11001" codepoint16="0X2B" codepoint="43" unicodeName="PLUS"/>
<char charname="H11002" codepoint16="0x2D" codepoint="45" unicodeName="MINUS"/>
<char charname="H11003" codepoint16="0XD7" codepoint="215" unicodeName="MULTIPLICATION SIGN"/>
<char charname="H11005" codepoint16="0X3D" codepoint="61" unicodeName="EQUALS"/>
</char>
任何人都可以将我指向这样的现有翻译表(理想情况下适用于所有 MathematicalPI 集)。[我不想要字形的图形显示,因为这意味着每个字形都必须作为 Unicode 等价物进行查找。]
似乎还有一个类似的符号资源,其中字符名的格式为 C223(用于版权)。任何有关这方面的信息将不胜感激。
更新:我需要的东西远远超出@user1808924 的答案——我已经通过自己的(部分)翻译表编译了,所以当然可以构建一个。可以下载并显示 MathematicalPI 中的字形列表(可能有数百个),并通过 Unicode 规范进行等价处理(对于大多数人,我认为有明确的等价关系)。一个令人满意的答案要么包括一个包含数百个等价物的表格,要么包括一个明确的声明,表明这将违反字体创建者的版权。
更新:在@minopret 和@Miguel 之间当然可以构造一个映射。MathPi 集合定义明确 - 几百个 - shapecatcher 可以很容易地找到最好的图形符号。映射不会是确定的(即带有 Adobe 的标记),但它是值得的。而且我怀疑在某些情况下,两个不同的字形本质上是相同的,因此视觉映射将不起作用——例如,等边三角形增量还是希腊大写字母 DELTA?
我怀疑我个人是否会完成一张完整的表格——我不知道某些符号是什么意思。但我希望制作一个用于科学技术医学 (STM) 出版的子集。
@user1808924 我注意到您在 SO 的第一天就回答了这个问题。对于有明确答案但很难找到的难题,通常会提供赏金问题(如本例所示)。除非您具有该领域的专业知识,否则提供意见或猜测通常没有用处。