unicode - unicode 中所有下标和变音符号的完整列表

Question

回答：http ://www.unicode.org/Public/UNIDATA/UnicodeData.txt是所有 unicode 字符的列表，并且 0xcc99 # U+0319 COMBINING RIGHT TACK BELOW 有点像等宽字体的逗号..（例如: 10̡9̡8̡7̡6̡5̡4̡3̡2̡1̡0̡)

是否有所有 unicode 字符及其口头描述的完整列表，例如... 0xcc99 # U+0319 COMBINING RIGHT TACK BELOW 之类的行列表..

特别是，我用什么变音符号来输入 1. 或 2 _o 3 ？动机是我希望能够在终端中以等宽字体添加点或逗号，而无需实际添加字符。

score 2 · Accepted Answer

没有所有 Unicode 字符及其口头描述的完整列表，甚至没有包含 Unicode 名称的列表。UnicodeData.txt 文件通常指的是大范围的字符，例如

4E00;<CJK Ideograph, First>;Lo;0;L;;;;;N;;;;;
9FCB;<CJK Ideograph, Last>;Lo;0;L;;;;;N;;;;;

和

AC00;<Hangul Syllable, First>;Lo;0;L;;;;;N;;;;;
D7A3;<Hangul Syllable, Last>;Lo;0;L;;;;;N;;;;;

可以用 Unicode 名称构建一个完整的列表，但目的是什么？Unicode 名称，例如 COMBINING PALATALIZED HOOK BELOW，是标识符，而不是描述。以英文文本为例，有些是直观的描述性的，有些是非常模糊的，有些是晦涩的，有些是完全错误的——由于稳定性原则，它们永远不会改变。该原则很大程度上是由于在程序中使用 Unicode 名称而需要的。不得更改它们，原因与不得更改 Unicode 数字的原因相同。

一些用于变音符号的 Unicode 名称也具有误导性，或者至少是不完整的。变音符号的形状不能仅从 Unicode 名称推断出来，形状甚至可能变化很大（例如，带 caron 的 t 是小写的 ť，变音符号看起来像 conna，而对应的大写字母 Ť 有.. . 嗯，一个类似卡隆的卡隆）。

在文本数据中使用 U+0319 和 U+0321 等字符意味着需要相对广泛的字体和相对先进的渲染软件，以很好地显示组合变音符号。此外，如果您打算在它们不打算用于的含义和上下文中使用它们（它们旨在用于与字母相关联以指示发音特征的注音符号），您可能需要不正确地实现它们的糟糕软件（考虑到预期用途和渲染）。例如，U+0319 应该出现在字母下方

score 0 · Accepted Answer

是的，它位于 TUS 随附的 CD 上，或者可从 unicode.org 下载：Unicode 字符数据库。

score 0 · Accepted Answer

“我的应用程序如下：有时我在 xterm 的命令行中使用输出长数字的程序，我觉得很难阅读。所以我想使用变音符号添加点或逗号，以便 2938485860 变为 2.938.485.860 并保留格式。 U+0321 不太适合那个……”

如果您想在内联数字中添加句点，有一种方法可以做到。在 unicode 中，有一组"Enclosed Alphanumerics"，其中包括带有尾随句点的数字。

2.938.485.860 -> ⒉93⒏48⒌860

请注意，在终端中，这些可能是不可读的。您也可以尝试

2⑨38④85⑧60 - 在每三个数字上使用带圆圈的数字（也很丑）
2̲9384̲8̲5̲860 - 使用 - 下划线字符
2388560 - 将一些数字更改为“数学无衬线粗体数字”

unicode - unicode 中所有下标和变音符号的完整列表

3 回答 3

Related

Reference