0

我有以下代码。

$pattern = '~[a-z0-9]+~';
preg_match_all($pattern, "some text from a website", $array); 

哪个适用于 en - The English Language 或 USA American Engish,但我如何使它适用于所有其他语言?我从 html 中检测到了追逐和语言。

编辑:我想我必须使用http://php.net/manual/en/regexp.reference.unicode.php - http://www.regular-expressions.info/unicode.html

任何人都知道我如何使用 Unicode 正则表达式在任何语言中匹配 (a-z0-9) 吗?

提前致谢。

4

1 回答 1

0

答案是使用代码正则表达式以任何语言表示 [a-z0-9] 的模式是:

$pattern = '~[\p{L}\p{Nd}]+~';

这里非常有用的文章:http ://www.regular-expressions.info/unicode.html

于 2013-01-21T01:59:19.003 回答