如何使用 regex.h 库找到所有包含至少一个非拉丁字母(阿拉伯文、中文...)的单词?
城市دبي
怎么样:
(?=\pL)(?![a-zA-Z])
这将匹配任何非拉丁字母的字母:
not ok - cityدبي
ok - city
not ok - دبي
试试这个 :
[a-zA-Z]*[^A-Za-z \d]+[a-zA-Z]*
含义:一个或多个非拉丁字母在一个或多个拉丁字母之前或之后,即包含至少 1 个非拉丁字符的单词。查看带有一些随机文本的演示: http ://regexr.com?326s3
您可能需要根据您的需要调整此正则表达式,并根据您的输入包括数字、特殊字符、单词边界等内容。
如果不匹配就使用[^a-zA-Z]
,它应该包含一个国际字符......