2

我在“现实生活”中遇到COMBINING LATIN SMALL LETTER C (U+0368)的可能性有多大(除了聪明的苏格兰人)?

我在问,因为它在Unicode Block Combining Diacritical MarksCategory Mark, Nonspacing [Mn]中。

因此,ICU Transliterator等实用程序(使用建议的音译或直接音译)似乎将其视为与COMBINING GRAVE ACCENT (U+0300)等字符相同。"NFD; [:Nonspacing Mark:] Remove; NFC""Latin-ASCII"

4

2 回答 2

2

可能性是完全不确定的,只是说如果你期望它不会发生,那么它就会发生。

于 2013-03-06T18:05:02.783 回答
2

可能性非常接近于零,但并不完全为零。您不能阻止任何人随意使用 Unicode 字符。Unicode 标准中没有关于 U+0368 的具体信息,但它已明确定义为一个组合字符,会导致符号 (c) 显示在前面的字符之上。我希望主要以中世纪手稿的数字化形式或类似的形式找到它。

在空格字符之后使用它,如在“聪明”页面中提到的那样,不是预期用途,但也不是无效的。Unicode 允许您在任何字符之后使用任何组合标记,无论它是否有意义。

它没有规范或兼容性分解,因此在您不能或不想保留角色的上下文中没有明确的方法来处理。

于 2013-03-06T18:25:44.170 回答