unicode - 为什么 NFKC 规范化会丢失上标和下标信息？

翻译自：https://stackoverflow.com/questions/50051868 2018-04-26T21:09:01.347

99 次

我注意到，在将 Unicode 字符串规范化为 NFKC 形式时，上标字符（如¹(U+00B9)、²(U+00B2)、³(U+00B3) 等）会转换为相应的 ASCII 数字（例如1、2、3等）。

有谁知道这种行为的理由？似乎它在此过程中丢失了信息。例如，上标数字通常具有某种上下文含义。

0 回答 0