2 回答
\p{IsLatin}
字符类将执行此操作。
IE,System.out.println(someString.matches("\\p{IsLatin}+"));
它在Pattern
类文档中被命名。
使用快速循环迭代所有可能的字符表明它匹配的完整字符集是:
ABCDEFGHIJKLMNOPQRSTU VWXYZ abcdefghijklmnopqrstu vwxyz ª º À Á Â Ã Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý Þ ß ì à á è í î ï ð ñ ò ó ô õ ö ø ù ú û ü ý þ ÿ Ā ā Ă ă Ą ą Ć ć Ĉ ĉ Ċ ċ Č č Ď ď Đ đ Ē ē Ĕ ĕ Ė ė Ę ę Ğ ě Ĝ ĝ Ġ ġ Ģ ģ Ĥ ĥ Ħ ħ Ĩ ĩ Ī ī Ĭ ĭ Į į İ ı IJ ij Ĵ ĵ Ķ ķ ĸ Ĺ ĺ Ļ ļ Ľ ľ Ŀ ŀ Ł ł Ń ōń Ņ ņ Ň Ō Ō Ō Ō Ŋ ŏ Œ œ Ŕ ŕ Ŗ ŗ Ř ř Ś ś Ŝ ŝ Ş ş Š š Ţ ţ Ť ť Ŧ ŧ Ũ ũ Ū ū Ŭ ŭ Ů ů Ű ű Ų Ƴ Ŵ ŵ Ŷ ŷ Ÿ Ź Ń Ž Ƶ Ł Ž wimanteɔɖƌƌǝɛɛɠɠɠɩɨƙƙƙƛɯɲɲƞɵɵơơƣƣƣƥƥƥƨƨʃʃʃʃ ƶƹƻƽƽƾǀǁǂ!dždžljljljljljnjnjnjnjnjnjǎǎǎǐǐǐǐǒǒǒǔǔǔǖǖǖǖǖǘǚǚǚǚ ǩǫǭǯǯǰdzdzǵǵƕƿǹǻǻǻǻǽǽǽǽǽǿǿǿȁȁȁȃȃȃȃȅȅȅȇȇȇȉȉȉȉȋȋȋȋ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σⱥȼȿɀɂƀʉʌɇɇɉɉɋɍɍɍɍɍɏɏɏɏɏɑɑɑɑɑɑɒɒɒɒɒɓɓɔɔɕɕɕɖɗɗɗɗɘɘɘ ɬɮɰɲɳɵɵɷɹɹɺɽɽɾɾɿʀʀʀʀʁʂʃʃʄʄʄʅʅʆʇʇʇʈʉʉʊʋʋʌʌʌʌ ʞʠʣʤʥʦʨʩʪʫʬʭʯʰʰʱʱʲʲʲʳʳʴʵʵʶʷʷʸʸˠˠˡˢˢˣˤˤᴀᴀᴀᴁᴃᴃᴃᴃ ᴒᴔᴗᴙᴙᴛᴜᴟᴟᴟᴟᴢᴢᴢᴢᴣᴤᴤᴥᴥᴥᴬᴬᴬᴭᴮᴯᴯᴰᴱᴱᴲᴲᴳᴳᴴᴴᴵᴶᴷᴷᴸᴸᴸᴺᴺᴼᴽ ᵊᵌᵏᵐᵑᵒᵔᵕᵖᵗᵘᵙᵛᵜᵜᵢᵢᵣᵣᵣᵤᵤᵥᵫᵫᵬᵭᵭᵮᵮᵯᵯᵰᵱᵱᵲᵳᵳᵴᵴᵴᵵᵷᵷᵷᵷ ᶇᶉᶌᶍᶎᶏᶑᶒᶓᶔᶕᶖᶘᶙᶙᶚᶚᶛᶛᶛᶜᶜᶝᶞᶞᶟᶠᶠᶡᶡᶢᶢᶣᶤᶤᶥᶦᶦᶧᶧᶧᶨᶪᶪᶪᶪ ᶹᶻᶾḁḁḃḃḅḇḇḉḋḋḍḍḍḍḍḏḏḏḏḏḏḑḑḑḓḓḕḕḕḕḕḕḕḗḗḗḗḙḙḙḙḙḛḛḛḛḝ ḭḯḱḳḳḵḵḷḹḹḻḻḽḿḿḿḿḿḿṁṁṁṁṁṁṁṁṃṃṃṃṅṅṅṅṅṅṅṅṅṅṅṅṅṉṉṉṉṉṋ Ṟ ṟ Ṡ ṡ Ṣ ṣ Ṥ ṥ Ṧ ṧ Ṩ ṩ Ṫ ṫ Ṭ ṭ Ṯ ṯ Ṱ ṱ Ṳ ṳ Ṵ ṵ Ṷ ṷ Ṹ ṹ Ṻ ṻṽṿẁẃẃẅẇẉẉẉẋẋẍẏẏẏẏẑẑẑẑẑẓẓẓẓẓẓẕẕẕẕẖẖẗẗẗẘẙẚẚ ắằẳẵẵặẹẹẻẻẽẽếềềềềểểểểểễễễệệệỉỉỉỉịịịọọọỏỏỏỏốốốố ỡợụủủứứừửửữữựỳỳỳỳỳỵỵỵỵỵỷỷỹỹỹỹỻỻỻỻỻỽỽỽỿỿỿỿⁱⁱ ⅎⅱⅴⅵⅷⅻⅻ ⱨⱬⱬɱɐɒⱱⱳⱴⱶⱶⱶⱹⱺⱺⱻⱻⱼⱼⱼⱽⱽȿɀꜣꜣꜣꜥꜥꜥꜧꜧꜧꜩꜩꜩꜩꜫꜫꜫꜭꜭꜭꜯꜯ ꜽꜿꝁꝃꝃꝅꝇꝇꝉꝉꝋꝋꝍꝏꝏꝏꝏꝑꝑꝑꝑꝑꝓꝓꝓꝕꝕꝕꝗꝗꝗꝗꝙꝙꝙꝛꝛꝛꝝꝝꝝꝝꝟꝟꝟꝟ ꝯꝰꝳꝴꝵꝶꝸꝺꝺꝼꝼᵹꝿꞁꞁꞁꞁꞃꞃꞃꞃꞃꞅꞅꞅꞇꞇꞇꞌꞌꞌꞌɥꞎꞎꞑꞑꞑꞓꞓꞓꞓꞡꞡꞡꞡ ꟽ ꟾ ꟿ ff fi f ffi ffl ſt st A B C D E F G H I J K L M O P Q R S T U V W X Y Z a b c de f Ng h i j k l m n o ρ q r st ü v w x y z</p>
如果这太多了,您可以将它与一些命名的 Unicode 块相交。
例如,这个字符类:
[\p{IsLatin}&&[\p{InBasic_Latin}\p{InLatin_1_Supplement}\p{InLatin_Extended_A}\p{InLatin_Extended_B}]]
将匹配:
ABCDEFGHIJKLMNOPQRSTU VWXYZ abcdefghijklmnopqrstu vwxyz ª º À Á Â Ã Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý Þ ß ì à á è í î ï ð ñ ò ó ô õ ö ø ù ú û ü ý þ ÿ Ā ā Ă ă Ą ą Ć ć Ĉ ĉ Ċ ċ Č č Ď ď Đ đ Ē ē Ĕ ĕ Ė ė Ę ę Ğ ě Ĝ ĝ Ġ ġ Ģ ģ Ĥ ĥ Ħ ħ Ĩ ĩ Ī ī Ĭ ĭ Į į İ ı IJ ij Ĵ ĵ Ķ ķ ĸ Ĺ ĺ Ļ ļ Ľ ľ Ŀ ŀ Ł ł Ń ōń Ņ ņ Ň Ō Ō Ō Ō Ŋ ŏ Œ œ Ŕ ŕ Ŗ ŗ Ř ř Ś ś Ŝ ŝ Ş ş Š š Ţ ţ Ť ť Ŧ ŧ Ũ ũ Ū ū Ŭ ŭ Ů ů Ű ű Ų Ƴ Ŵ ŵ Ŷ ŷ Ÿ Ź Ń Ž Ƶ Ł Ž wimanteɔɖƌƌǝɛɛɠɠɠɩɨƙƙƙƛɯɲɲƞɵɵơơƣƣƣƥƥƥƨƨʃʃʃʃ ƶƹƻƽƽƾǀǁǂ!dždžljljljljljnjnjnjnjnjnjǎǎǎǐǐǐǐǒǒǒǔǔǔǖǖǖǖǖǘǚǚǚǚ ǩǫǭǯǯǰdzdzǵǵƕƿǹǻǻǻǻǽǽǽǽǽǿǿǿȁȁȁȃȃȃȃȅȅȅȇȇȇȉȉȉȉȋȋȋȋ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σş
使用以下模式(\p{L}
匹配任何 unicode 字符):
[\p{L}]+