1
4

2 回答 2

11

\p{IsLatin}字符类将执行此操作。

IE,System.out.println(someString.matches("\\p{IsLatin}+"));

它在Pattern类文档中被命名。

使用快速循环迭代所有可能的字符表明它匹配的完整字符集是:

ABCDEFGHIJKLMNOPQRSTU VWXYZ abcdefghijklmnopqrstu vwxyz ª º À Á Â Ã Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý Þ ß ì à á è í î ï ð ñ ò ó ô õ ö ø ù ú û ü ý þ ÿ Ā ā Ă ă Ą ą Ć ć Ĉ ĉ Ċ ċ Č č Ď ď Đ đ Ē ē Ĕ ĕ Ė ė Ę ę Ğ ě Ĝ ĝ Ġ ġ Ģ ģ Ĥ ĥ Ħ ħ Ĩ ĩ Ī ī Ĭ ĭ Į į İ ı IJ ij Ĵ ĵ Ķ ķ ĸ Ĺ ĺ Ļ ļ Ľ ľ Ŀ ŀ Ł ł Ń ōń Ņ ņ Ň Ō Ō Ō Ō Ŋ ŏ Œ œ Ŕ ŕ Ŗ ŗ Ř ř Ś ś Ŝ ŝ Ş ş Š š Ţ ţ Ť ť Ŧ ŧ Ũ ũ Ū ū Ŭ ŭ Ů ů Ű ű Ų Ƴ Ŵ ŵ Ŷ ŷ Ÿ Ź Ń Ž Ƶ Ł Ž wimanteɔɖƌƌǝɛɛɠɠɠɩɨƙƙƙƛɯɲɲƞɵɵơơƣƣƣƥƥƥƨƨʃʃʃʃ ƶƹƻƽƽƾǀǁǂ!dždžljljljljljnjnjnjnjnjnjǎǎǎǐǐǐǐǒǒǒǔǔǔǖǖǖǖǖǘǚǚǚǚ ǩǫǭǯǯǰdzdzǵǵƕƿǹǻǻǻǻǽǽǽǽǽǿǿǿȁȁȁȃȃȃȃȅȅȅȇȇȇȉȉȉȉȋȋȋȋ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σⱥȼȿɀɂƀʉʌɇɇɉɉɋɍɍɍɍɍɏɏɏɏɏɑɑɑɑɑɑɒɒɒɒɒɓɓɔɔɕɕɕɖɗɗɗɗɘɘɘ ɬɮɰɲɳɵɵɷɹɹɺɽɽɾɾɿʀʀʀʀʁʂʃʃʄʄʄʅʅʆʇʇʇʈʉʉʊʋʋʌʌʌʌ ʞʠʣʤʥʦʨʩʪʫʬʭʯʰʰʱʱʲʲʲʳʳʴʵʵʶʷʷʸʸˠˠˡˢˢˣˤˤᴀᴀᴀᴁᴃᴃᴃᴃ ᴒᴔᴗᴙᴙᴛᴜᴟᴟᴟᴟᴢᴢᴢᴢᴣᴤᴤᴥᴥᴥᴬᴬᴬᴭᴮᴯᴯᴰᴱᴱᴲᴲᴳᴳᴴᴴᴵᴶᴷᴷᴸᴸᴸᴺᴺᴼᴽ ᵊᵌᵏᵐᵑᵒᵔᵕᵖᵗᵘᵙᵛᵜᵜᵢᵢᵣᵣᵣᵤᵤᵥᵫᵫᵬᵭᵭᵮᵮᵯᵯᵰᵱᵱᵲᵳᵳᵴᵴᵴᵵᵷᵷᵷᵷ ᶇᶉᶌᶍᶎᶏᶑᶒᶓᶔᶕᶖᶘᶙᶙᶚᶚᶛᶛᶛᶜᶜᶝᶞᶞᶟᶠᶠᶡᶡᶢᶢᶣᶤᶤᶥᶦᶦᶧᶧᶧᶨᶪᶪᶪᶪ ᶹᶻᶾḁḁḃḃḅḇḇḉḋḋḍḍḍḍḍḏḏḏḏḏḏḑḑḑḓḓḕḕḕḕḕḕḕḗḗḗḗḙḙḙḙḙḛḛḛḛḝ ḭḯḱḳḳḵḵḷḹḹḻḻḽḿḿḿḿḿḿṁṁṁṁṁṁṁṁṃṃṃṃṅṅṅṅṅṅṅṅṅṅṅṅṅṉṉṉṉṉṋ Ṟ ṟ Ṡ ṡ Ṣ ṣ Ṥ ṥ Ṧ ṧ Ṩ ṩ Ṫ ṫ Ṭ ṭ Ṯ ṯ Ṱ ṱ Ṳ ṳ Ṵ ṵ Ṷ ṷ Ṹ ṹ Ṻ ṻṽṿẁẃẃẅẇẉẉẉẋẋẍẏẏẏẏẑẑẑẑẑẓẓẓẓẓẓẕẕẕẕẖẖẗẗẗẘẙẚẚ ắằẳẵẵặẹẹẻẻẽẽếềềềềểểểểểễễễệệệỉỉỉỉịịịọọọỏỏỏỏốốốố ỡợụủủứứừửửữữựỳỳỳỳỳỵỵỵỵỵỷỷỹỹỹỹỻỻỻỻỻỽỽỽỿỿỿỿⁱⁱ ⅎⅱⅴⅵⅷⅻⅻ ⱨⱬⱬɱɐɒⱱⱳⱴⱶⱶⱶⱹⱺⱺⱻⱻⱼⱼⱼⱽⱽȿɀꜣꜣꜣꜥ​​ꜥꜥꜧꜧꜧꜩꜩꜩꜩꜫꜫꜫꜭꜭꜭꜯꜯ ꜽꜿꝁꝃꝃꝅꝇꝇꝉꝉꝋꝋꝍꝏꝏꝏꝏꝑꝑꝑꝑꝑꝓꝓꝓꝕꝕꝕꝗꝗꝗꝗꝙꝙꝙꝛꝛꝛꝝꝝꝝꝝꝟꝟꝟꝟ ꝯꝰꝳꝴꝵꝶꝸꝺꝺꝼꝼᵹꝿꞁꞁꞁꞁꞃꞃꞃꞃꞃꞅꞅꞅꞇꞇꞇꞌꞌꞌꞌɥꞎꞎꞑꞑꞑꞓꞓꞓꞓꞡꞡꞡꞡ ꟽ ꟾ ꟿ ff fi f ffi ffl ſt st A B C D E F G H I J K L M O P Q R S T U V W X Y Z a b c de f Ng h i j k l m n o ρ q r st ü v w x y z</p>

如果这太多了,您可以将它与一些命名的 Unicode 块相交。

例如,这个字符类:

[\p{IsLatin}&&[\p{InBasic_Latin}\p{InLatin_1_Supplement}\p{InLatin_Extended_A}\p{InLatin_Extended_B}]]

将匹配:

ABCDEFGHIJKLMNOPQRSTU VWXYZ abcdefghijklmnopqrstu vwxyz ª º À Á Â Ã Å Æ Ç È É Ê Ë Ì Í Î Ï Ñ Ò Ó Ô Õ Ö Ø Ù Ú Û Ü Ý Þ ß ì à á è í î ï ð ñ ò ó ô õ ö ø ù ú û ü ý þ ÿ Ā ā Ă ă Ą ą Ć ć Ĉ ĉ Ċ ċ Č č Ď ď Đ đ Ē ē Ĕ ĕ Ė ė Ę ę Ğ ě Ĝ ĝ Ġ ġ Ģ ģ Ĥ ĥ Ħ ħ Ĩ ĩ Ī ī Ĭ ĭ Į į İ ı IJ ij Ĵ ĵ Ķ ķ ĸ Ĺ ĺ Ļ ļ Ľ ľ Ŀ ŀ Ł ł Ń ōń Ņ ņ Ň Ō Ō Ō Ō Ŋ ŏ Œ œ Ŕ ŕ Ŗ ŗ Ř ř Ś ś Ŝ ŝ Ş ş Š š Ţ ţ Ť ť Ŧ ŧ Ũ ũ Ū ū Ŭ ŭ Ů ů Ű ű Ų Ƴ Ŵ ŵ Ŷ ŷ Ÿ Ź Ń Ž Ƶ Ł Ž wimanteɔɖƌƌǝɛɛɠɠɠɩɨƙƙƙƛɯɲɲƞɵɵơơƣƣƣƥƥƥƨƨʃʃʃʃ ƶƹƻƽƽƾǀǁǂ!dždžljljljljljnjnjnjnjnjnjǎǎǎǐǐǐǐǒǒǒǔǔǔǖǖǖǖǖǘǚǚǚǚ ǩǫǭǯǯǰdzdzǵǵƕƿǹǻǻǻǻǽǽǽǽǽǿǿǿȁȁȁȃȃȃȃȅȅȅȇȇȇȉȉȉȉȋȋȋȋ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σ Σş

于 2014-12-30T15:15:18.450 回答
0

使用以下模式(\p{L}匹配任何 unicode 字符):

[\p{L}]+
于 2014-12-30T15:10:18.057 回答