0

我正在生成 CSV 文件。有时,数据源会传递带有重音符号等的字符……我想去掉这些字符。是否有一种相当直接的方法来检测和去除 UTF-8 字符?

4

2 回答 2

1

如果您确定将 UTF-8 作为输入,请使用 iconv 将值转换为您在输出中使用的编码 - 检测 UTF-8 字符不是故障安全的(因为这些值是有效的 iso-8859 -1 个字符(或所有 8 位编码,真的)。

如果您只想使用常规的 ascii 值集(字节值 0 - 127),可以让 iconv 转换为 'ascii' 编码并音译:

iconv("utf-8", "ascii//TRANSLIT", "Hei og hå")

将导致

hei og ha

被退回。

于 2012-08-07T22:31:48.567 回答
0
utf8_decode($string)

然而,这可能会混淆一些在 utf-8 中可用但在 iso88591 中不可用的字符

于 2012-08-07T22:31:18.317 回答