我有一个 dom 文档,我想在其中附加一些特殊字符。
我正在做的是首先用正则表达式检测字符串中的特殊字符。为此,我将 html 上的 utf-8 字符转换为
$string = "Test string 1,§,†,‡";
$string_html = htmlentities($string_html, ENT_QUOTES, "UTF-8");
这工作正常,我到了那里:
"Test string 1,§,†,‡"
现在,我只想获取特殊字符。我正在使用一个正则表达式,它返回一个数组:
[0] => '§';
[1] => '&dagger';
[2] => '&Dagger';
现在,我想将这些特殊字符附加到我的 dom 文档中,但使用 unicode。我在尝试:
$string_utf8 = html_entity_decode($string_html);
$dom_output->createElement( 'string', utf8_encode($string_utf8));
结果如下:
§ 字符显示为 §,而 † 和 ‡ 保持不变。
知道为什么吗?