我有标题中描述的问题。如果我使用
preg_match_all('/\pL+/u', $_POST['word'], $new_word);
我输入hello à 和 ì返回的 new_word 是 *hello 和 * 为什么?
有人建议我指定我想以这种方式转换的所有字符
preg_match_all('/\pL+/u', $_POST['word'], 'aäeëioöuáéíóú');
,但我希望我的应用程序适用于所有现有的口音(对于多语言网站)。你能帮助我吗?谢谢。
编辑:我指定我使用这个正则表达式来净化标点符号。它很好地净化了所有标点符号,但 unicode 字符错误返回,实际上甚至没有返回。
编辑2:对不起,我解释得很糟糕。问题不在 preg_match_all 而是在
str_word_count($my_key, 2, 'aäáàeëéèiíìoöóòuúù');
我必须手动指定重音字符,但我认为还有很多其他字符。正确的?