15

我听说有些字符在 Unicode 标准中不存在,尽管某些地区的人们在日常生活中编写了这些字符。尤其是最近听说过将现有汉字部分拼凑而成的中文名字,但我找不到任何参考资料。

例如,下面的字符在 5000 万人中非常常见,但直到2009 年10 月才出现在 Unicode 中

在此处输入图像描述

有这样的字符列表吗?(图像,或列出图像等字符的网站)

4

4 回答 4

8

好吧,Unicode 中没有很多东西(尽管仍在添加新字符)。

一些例子:

  • 由于汉化,Unicode 使用一个代码点来表示来自不同语言的几个相似字符。人们不同意这些角色是否真的“相同”;如果您认为它们应该单独表示,那么这些单独的表示可以说是“缺失的”(尽管这是一个哲学问题)。
  • 与此类似,许多语言(尤其是亚洲语言)有时具有一个字符/字形的多个变体。“一个字符具有多个表示”(=一个代码点)和“不同字符”(=不同的代码点)之间的区别有些武断,因此在某些情况下(例如汉字字符),有些人会觉得替代变体“缺失”。
  • 许多历史悠久且很少使用的字符丢失了。
  • 许多旧的/历史的脚本没有被涵盖,例如Demotic。实际上,有一个专门用于在 Unicode 中包含更多脚本的倡议,即脚本编码倡议(SEI)。

W3C 还有一个关于这个主题的页面,Missing characters and glyphs,有更多解释。

于 2011-06-08T09:45:08.820 回答
8

另外:这是 unicode.org 的不支持脚本列表

于 2011-06-08T22:48:27.963 回答
3

令人讨厌的是,标准的符号部分中没有包含大量字符。

请参阅https://web.archive.org/web/20210830121541/http://xahlee.info/comp/unicode_arrows.html的“缺少对称版本”部分,了解存在的一堆箭头符号,但仅限于某些方向. 有些只是愚蠢的。例如,有 ⥂、⥃ 和 ⥄,但没有最后一个的正确指向版本。

你可以从http://en.wikipedia.org/wiki/Unicode_subscripts_and_superscripts看到他们显然随机选择了哪些字母以超级和子脚本形式支持。例如,它们包括下标元音 a、e、o 甚至 schwa (ə),但不包括 i,这将非常有用,因为它是数学排版中的常见下标。查看 wikipedia 文章了解更多详细信息(您需要安装 unicode 字体,因为至少在撰写本文时它们没有明确列出常规的 ascii 等价物),但基本上他们似乎选择了大约一半的拉丁字母随机为每个大写和小写的上标和下标字符。

此外,不存在许多便于使用 unicode 构建形状的符号。

于 2011-08-17T00:42:15.630 回答
1

它不支持双唇颤音字母,变贝塔,反转k。

于 2020-02-23T22:52:24.647 回答