我想从任何短语中分别提取每个单词。我还需要匹配特殊字符,例如变音符号。
目前,我使用这个:
preg_match_all('/\b([a-zA-ZäöüåÄÖÜÅ]*)\b/', $string, $matches);
但是,这给了我冗余和空匹配。例如,“zu spät”返回
Array ( [0] => Array ( [0] => zu [1] => [2] => spät [3] => )
[1] => Array ( [0] => zu [1] => [2] => spät [3] => ) )
匹配“任意字母”的正确表达方式是什么?我能对双匹配和空匹配做些什么?