windows - 如何获取 Unicode 字符的字形 unicode 表示

Question

Windows 使用 uniscribe 库根据位置替换阿拉伯文和印地语字符。新字形仍然具有输入字符的原始 unicode，尽管它在 Unicode 中有其专用表示如何获取实际显示内容而不是输入内容的 Unicode。

score 0 · Accepted Answer

有很多工具可以解决这个问题，比如 ICU、Charmap 等等。我自己推荐http://unicode.codeplex.com，它使用Unicode 字符数据库来表示字符。

请注意，unicode 只是关于字符的一些信息，从未谈到表示。他们只是建议像他们的例子一样实现一个词。以便查看您需要的每个代码，Standard Unicode Font例如MS Arial Unicode，这是 Windows 平台中最大和最好的选择。

大多数字符都是用这种字体实现的，但是对于新字符，您需要对其进行更新（如果有这样的更新），或者您可以使用您知道它实现了您想要的字符的字体

score 0 · Accepted Answer

您对 Uniscribe 中发生的事情的解释是不正确的。一旦有了字形，原始信息就消失了，就没有可靠的方法可以返回 Unicode。

即使不去阿拉伯语，也无法区分 fi 连字的字形（例如）是来自 'f' 和 'i' (U+0066 U+0069) 还是来自 'fi' (U+FB01) . （http://www.fileformat.info/info/unicode/char/fb01/index.htm）

此外，一些生成的字形没有与之关联的 Unicode 值，因此没有“实际显示的 Unicode”

2 回答 2