我正在生成 CSV 文件。有时,数据源会传递带有重音符号等的字符……我想去掉这些字符。是否有一种相当直接的方法来检测和去除 UTF-8 字符?
问问题
77 次
2 回答
1
如果您确定将 UTF-8 作为输入,请使用 iconv 将值转换为您在输出中使用的编码 - 检测 UTF-8 字符不是故障安全的(因为这些值是有效的 iso-8859 -1 个字符(或所有 8 位编码,真的)。
如果您只想使用常规的 ascii 值集(字节值 0 - 127),可以让 iconv 转换为 'ascii' 编码并音译:
iconv("utf-8", "ascii//TRANSLIT", "Hei og hå")
将导致
hei og ha
被退回。
于 2012-08-07T22:31:48.567 回答
0
utf8_decode($string)
然而,这可能会混淆一些在 utf-8 中可用但在 iso88591 中不可用的字符
于 2012-08-07T22:31:18.317 回答