Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
CJK 字符集的正则表达式的模拟是什么?ASCII 或类似拉丁字母的字符与 CJK 字符有质的区别?
CJK 字符集的正则表达式的模拟是什么?
正则表达式。它一直能够处理不同的字符集,但是使用 Unicode 变得更加简单和可靠。
您使用什么语言/环境?一般来说,现代实现都支持 Unicode 字符,尽管有些可能缺少扩展功能,例如\p{...}字符类。
\p{...}
ASCII 或类似拉丁字母的字符与 CJK 字符有质的区别?
CJK 表意文字和音节没有大小写,因此它们是“字母,其他”类别的成员,而不是大多数拉丁字母的“字母,大写字母”或“字母,小写字母”。它们还具有不同的换行属性。