4

可以在字符类中指定的 unicode groups和是什么?block ranges\p{name}

例如

\p{IsGreek}

名称和描述列表在哪里可用?

4

2 回答 2

5

Regular-Expressions.info有列表。

您还可以询问 PCRE 本身的手册页

Unicode 字符集被定义为属于某些脚本。可以使用脚本名称匹配其中一组字符。例如:

\p{Greek}
\P{Han}

那些不属于已识别脚本的部分被归为“通用”。当前的脚本列表是:

阿拉伯语、亚美尼亚语、阿维斯坦语、巴厘岛语、Bamum、孟加拉语、Bopomofo、盲文、Buginese、Buhid、Canadian_Aboriginal、Carian、Cham、Cherokee、常见、科普特语、楔形文字、塞浦路斯语、西里尔语、Deseret、梵文、埃及象形文字、埃塞俄比亚语、格鲁吉亚语、格拉哥里语、哥特语、希腊语、古吉拉特语、古尔穆奇语、汉语、韩语、哈努努语、希伯来语、平假名、帝国亚拉姆语、继承的、Inscriptional_Pahlavi、Inscriptional_Parthian、爪哇语、Kaithi、卡纳达语、片假名、Kayah_Li、Kharoshthi、高棉语、老挝语、拉丁语、Lepcha、Limbu、Linear_B、 Lisu, Lycian, Lydian, Malayalam, Meetei_Mayek, 蒙古语, 缅甸, New_Tai_Lue, Nko, Ogham, Old_Italic, Old_Persian, Old_South_Arabian, Old_Turkic, Ol_Chiki, Oriya, Osmanya, Phags_Pa, Phoenician, Rejang, Runic, Samaritan, Saurashtra, Shavian, Sinhala,巽他语、Syloti_Nagri、叙利亚语、Tagalog、Tagbanwa、Tai_Le、Tai_Tham、Tai_Viet、泰米尔语、泰卢固语、Thaana、泰语、藏语、Tifinagh、Ugaritic、Vai、Yi。

于 2012-01-25T12:32:56.617 回答
2

在这里,您可以找到可以在括号中指定的Unicode 字符属性列表: http ://en.wikipedia.org/wiki/Mapping_of_Unicode_characters#Categories

或者您可以匹配Unicode BlocksScripts,您可以在此处找到相关信息: http ://www.regular-expressions.info/unicode.html#block和http://www.regular-expressions.info/unicode.html #脚本

于 2012-01-25T12:35:26.367 回答