8

我想知道unicode.org提出的将 unicode 字符转换为小写的标准算法。

另外,大多数编程语言是否遵循这个提议的标准?

4

3 回答 3

5

我想知道 unicode.org 提出的将 unicode 字符转换为小写的标准算法。

基本算法只是连接每个单独字符的小写字母(由UnicodeData.txt中的倒数第二列定义)。还有一些特殊的规则来处理多字符映射(İ → i̇ 与 i 上方的额外组合点)、条件映射(Σ → ς 在单词末尾,但 σ 否则)和语言敏感规则(像土耳其的无点 ı)。

另外,大多数编程语言是否遵循这个提议的标准?

Java 可以。Python 实现了基本规则,但没有实现特殊规则。C 根本没有标准化的 Unicode 支持。

于 2010-08-20T06:20:24.723 回答
2

.NET 确实支持 unicode,并提供了在大小写之间切换的内置函数。这可能也适用于其他一些语言。

于 2010-08-19T13:57:47.410 回答
1

编程语言对 unicode 的支持程度各不相同。大多数没有 unicode 字符作为内置类型。通常,它要么在库中处理,要么由操作系统调用处理。

例如,C++ 没有本机 unicode 字符类型,但在 stl(它被定义为语言的一部分)中支持语言环境。Ada 确实有一个原生类型 Wide_Character,以及用于操作它的库支持。

于 2010-08-19T13:56:10.020 回答