问问题
1207 次
1 回答
6
Unicode 提供了这个工具来确定字符集。它使用带有属性值对的正则表达式,包含在[::]
.
对于 Unicode 5 中的所有字符,您都想做[:age=5.0:]
.
其余的是“一般类别”(gc)。因此,例如[:age=5.0:]&[:gc=Lu:]
会在 Unicode 5 中找到所有大写字母(gc=L
通常会找到所有字母)。
对于 IdentifierStart,您需要[:age=5.0:]&[[:gc=L:][:gc=Nl:]\$_]
. 对于 IdentifierPart 你需要[:age=5.0:]&[[:gc=L:][:gc=Nl:][:gc=Mn:][:gc=Mc:][:gc=Nd:][:gc=Pc:]\$_]
.
Unicode 还具有称为 ID_Start 和 ID_Continue 的属性,但它们不包含与您的规范相同的字符。
这里也是所有 Unicode 字符属性的概述。
于 2017-04-02T00:24:46.863 回答