0

Windows 使用 uniscribe 库根据位置替换阿拉伯文和印地语字符。新字形仍然具有输入字符的原始 unicode,尽管它在 Unicode 中有其专用表示 如何获取实际显示内容而不是输入内容的 Unicode。

4

2 回答 2

0

有很多工具可以解决这个问题,比如 ICU、Charmap 等等。我自己推荐http://unicode.codeplex.com,它使用Unicode 字符数据库来表示字符。

请注意,unicode 只是关于字符的一些信息,从未谈到表示。他们只是建议像他们的例子一样实现一个词。以便查看您需要的每个代码,Standard Unicode Font例如MS Arial Unicode,这是 Windows 平台中最大和最好的选择。

大多数字符都是用这种字体实现的,但是对于新字符,您需要对其进行更新(如果有这样的更新),或者您可以使用您知道它实现了您想要的字符的字体

于 2011-05-25T10:34:32.293 回答
0

您对 Uniscribe 中发生的事情的解释是不正确的。一旦有了字形,原始信息就消失了,就没有可靠的方法可以返回 Unicode。

即使不去阿拉伯语,也无法区分 fi 连字的字形(例如)是来自 'f' 和 'i' (U+0066 U+0069) 还是来自 'fi' (U+FB01) . (http://www.fileformat.info/info/unicode/char/fb01/index.htm

此外,一些生成的字形没有与之关联的 Unicode 值,因此没有“实际显示的 Unicode”

于 2011-05-28T09:52:55.600 回答