将规则"NFD; [:Nonspacing Mark:] Remove; NFC"
输入ICU Transliterator demo,字符Ø
( \u00d8
== LATIN CAPITAL LETTER O WITH STROKE
) 保持原样(即 STROKE 未被剥离)。
在非标记空间列表(Category Mn
) 中,我找不到任何COMBINING DIAGONAL STROKE
类似于COMBINING SHORT STROKE OVERLAY
( \u0335
) 或COMBINING LONG STROKE OVERLAY
( \u0336
) 的名称。
但是,我确实找到了COMBINING SHORT SOLIDUS OVERLAY
( \u0337
) 和COMBINING LONG SOLIDUS OVERLAY
( \u0338
)。o
它们看起来很相似,但在我的浏览器中与和结合使用时会呈现出更粗的线条O
。
我访问的Unicode 数据\u00d8
不提供该字符的分解。
同时,ICU Collator Demo将使用 Primary (Level = 1 = Base Letter) Collator 将 、 、 、 和 中的每一个整理到ø
相同o
的Ø
代码点O
。o\u0337
O\u0338
这是否意味着 Demo 中使用的 Collator 的语言环境已设置为以 Unicode 规范没有提及的方式识别基本字符?
如果是这样,如果我想从LATIN [CAPITAL, SMALL] LETTER *
音译字符中删除笔划,是否需要自定义基于规则的音译器?