我的正则表达式不会考虑重音字符,因此在搜索包含 ü、õ、ö 或 ä 字符的单词时找不到任何匹配项。
$data 是使用 strip_tags 从 HTML 标记中剥离的 HTML 数据,其中包含通过 CURL 从具有字符编码 UTF-8 的网站加载的带有 ü、õ、ö 和 ä 字符的单词(如返回的标题告诉我的那样);
$data = strip_tags( curl_exec('my_website_url') );
$match = preg_match( '/ü/' , $data , $matches );
我尝试使用以下(也使用“ISO-8859-1”):
mb_internal_encoding("UTF-8");
mb_regex_encoding('UTF-8');
或者:
$data = utf8_decode($data)
还没有成功。