0

回答:http ://www.unicode.org/Public/UNIDATA/UnicodeData.txt是所有 unicode 字符的列表,并且 0xcc99 # U+0319 COMBINING RIGHT TACK BELOW 有点像等宽字体的逗号..(例如: 10̡9̡8̡7̡6̡5̡4̡3̡2̡1̡0̡)

是否有所有unicode 字符及其口头描述的完整列表,例如... 0xcc99 # U+0319 COMBINING RIGHT TACK BELOW 之类的行列表..

特别是,我用什么变音符号来输入 1. 或 2 o 3 ?动机是我希望能够在终端 中以等宽字体添加点或逗号,而无需实际添加字符。

4

3 回答 3

2

没有所有 Unicode 字符及其口头描述的完整列表,甚至没有包含 Unicode 名称的列表。UnicodeData.txt 文件通常指的是大范围的字符,例如

4E00;<CJK Ideograph, First>;Lo;0;L;;;;;N;;;;;
9FCB;<CJK Ideograph, Last>;Lo;0;L;;;;;N;;;;;

AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;

可以用 Unicode 名称构建一个完整的列表,但目的是什么?Unicode 名称,例如 COMBINING PALATALIZED HOOK BELOW,是标识符,而不是描述。以英文文本为例,有些是直观的描述性的,有些是非常模糊的,有些是晦涩的,有些是完全错误的——由于稳定性原则,它们永远不会改变。该原则很大程度上是由于在程序中使用 Unicode 名称而需要的。不得更改它们,原因与不得更改 Unicode 数字的原因相同。

一些用于变音符号的 Unicode 名称也具有误导性,或者至少是不完整的。变音符号的形状不能仅从 Unicode 名称推断出来,形状甚至可能变化很大(例如,带 caron 的 t 是小写的 ť,变音符号看起来像 conna,而对应的大写字母 Ť 有.. . 嗯,一个类似卡隆的卡隆)。

在文本数据中使用 U+0319 和 U+0321 等字符意味着需要相对广泛的字体相对先进的渲染软件,以很好地显示组合变音符号。此外,如果您打算在它们不打算用于的含义和上下文中使用它们(它们旨在用于与字母相关联以指示发音特征的注音符号),您可能需要不正确地实现它们的糟糕软件(考虑到预期用途和渲染)。例如,U+0319 应该出现在字母下方

于 2011-12-29T11:54:09.127 回答
0

是的,它位于 TUS 随附的 CD 上,或者可从 unicode.org 下载:Unicode 字符数据库。

于 2011-12-29T01:34:51.417 回答
0

“我的应用程序如下:有时我在 xterm 的命令行中使用输出长数字的程序,我觉得很难阅读。所以我想使用变音符号添加点或逗号,以便 2938485860 变为 2.938.485.860 并保留格式。 U+0321 不太适合那个……”

如果您想在内联数字中添加句点,有一种方法可以做到。在 unicode 中,有一组"Enclosed Alphanumerics",其中包括带有尾随句点的数字。

2.938.485.860 -> ⒉93⒏48⒌860

请注意,在终端中,这些可能是不可读的。您也可以尝试

  • 2⑨38④85⑧60 - 在每三个数字上使用带圆圈的数字(也很丑)
  • 2̲9384̲8̲5̲860 - 使用 - 下划线字符
  • 2388560 - 将一些数字更改为“数学无衬线粗体数字”
于 2014-05-10T16:52:44.823 回答