可以在字符类中指定的 unicode groups
和是什么?block ranges
\p{name}
例如
\p{IsGreek}
名称和描述列表在哪里可用?
可以在字符类中指定的 unicode groups
和是什么?block ranges
\p{name}
例如
\p{IsGreek}
名称和描述列表在哪里可用?
您还可以询问 PCRE 本身的手册页:
Unicode 字符集被定义为属于某些脚本。可以使用脚本名称匹配其中一组字符。例如:
\p{Greek} \P{Han}
那些不属于已识别脚本的部分被归为“通用”。当前的脚本列表是:
阿拉伯语、亚美尼亚语、阿维斯坦语、巴厘岛语、Bamum、孟加拉语、Bopomofo、盲文、Buginese、Buhid、Canadian_Aboriginal、Carian、Cham、Cherokee、常见、科普特语、楔形文字、塞浦路斯语、西里尔语、Deseret、梵文、埃及象形文字、埃塞俄比亚语、格鲁吉亚语、格拉哥里语、哥特语、希腊语、古吉拉特语、古尔穆奇语、汉语、韩语、哈努努语、希伯来语、平假名、帝国亚拉姆语、继承的、Inscriptional_Pahlavi、Inscriptional_Parthian、爪哇语、Kaithi、卡纳达语、片假名、Kayah_Li、Kharoshthi、高棉语、老挝语、拉丁语、Lepcha、Limbu、Linear_B、 Lisu, Lycian, Lydian, Malayalam, Meetei_Mayek, 蒙古语, 缅甸, New_Tai_Lue, Nko, Ogham, Old_Italic, Old_Persian, Old_South_Arabian, Old_Turkic, Ol_Chiki, Oriya, Osmanya, Phags_Pa, Phoenician, Rejang, Runic, Samaritan, Saurashtra, Shavian, Sinhala,巽他语、Syloti_Nagri、叙利亚语、Tagalog、Tagbanwa、Tai_Le、Tai_Tham、Tai_Viet、泰米尔语、泰卢固语、Thaana、泰语、藏语、Tifinagh、Ugaritic、Vai、Yi。
在这里,您可以找到可以在括号中指定的Unicode 字符属性列表: http ://en.wikipedia.org/wiki/Mapping_of_Unicode_characters#Categories
或者您可以匹配Unicode Blocks或Scripts,您可以在此处找到相关信息: http ://www.regular-expressions.info/unicode.html#block和http://www.regular-expressions.info/unicode.html #脚本。