对于 Basic Multilingual Plane 中的字符,我们可以使用 '\uxxxx' 转义它。例如,您可以使用 /[\u4e00-\u9fff]/ 来匹配一个常见的汉字(0x4e00-0x9fff 是 CJK 统一表意文字的范围)。
但是对于基本多语言平面之外的字符,它们的代码大于 0xffff。所以你不能使用格式'\uxxxx'来转义它,因为'\u20000'表示字符'\u2000'和字符'0',而不是代码为0x20000的字符。
如何将字符转义出基本多语言平面?直接使用这些字符不是一个好主意,因为它们无法在大多数字体中显示。