-1

CJK 字符集的正则表达式的模拟是什么?ASCII 或类似拉丁字母的字符与 CJK 字符有质的区别?

4

1 回答 1

1

CJK 字符集的正则表达式的模拟是什么?

正则表达式。它一直能够处理不同的字符集,但是使用 Unicode 变得更加简单和可靠。

您使用什么语言/环境?一般来说,现代实现都支持 Unicode 字符,尽管有些可能缺少扩展功能,例如\p{...}字符类。

ASCII 或类似拉丁字母的字符与 CJK 字符有质的区别?

CJK 表意文字和音节没有大小写,因此它们是“字母,其他”类别的成员,而不是大多数拉丁字母的“字母,大写字母”或“字母,小写字母”。它们还具有不同的换行属性。

于 2012-08-19T08:38:50.333 回答