可能重复:
如何替换字符串中的�
我正在从来自数据库的 XML 表中读取数据。在原始输出中,我遇到了这个字符“�”,它是 UTF-8 字符串,意思是“�”。在搜索“�”或“�”时,使用 str_replace 进行简单的搜索和删除并不能解决问题。有没有其他方法可以从字符串中删除这个字符?
更新:
作为参考,这是为我清理字符串的函数。
function db_utf8_convert($str)
{
$convmap = array(0x80, 0x10ffff, 0, 0xffffff);
return preg_replace('/\x{EF}\x{BF}\x{BD}/u', '', mb_encode_numericentity($str, $convmap, "UTF-8"));
}