我需要从我正在使用 Curl 和 simplehtml dom 解析的网站中删除所有狡猾的 html 字符。
<?php
$html = "this is a text";
var_dump($html);
var_dump(html_entity_decode($html,ENT_COMPAT,"UTF-8"));
哪个输出
string(19) "这是一个文本"
string(15) "这是┬á文本"
我不想使用 preg*,因为文本中有其他字符(例如 °)。这让我快疯了!
谢谢,詹姆斯