2

我收到一封使用 charset 的电子邮件iso-8859-8-i。iconv 说它是一个不受支持的字符集。我尝试使用iso-8859-8,但出现“无效的多字节序列”错误。知道如何将此字符串转换为 UTF-8 吗?

4

1 回答 1

9

只需将编码名称替换为"iso-8859-8". 后缀是为了-i表明它是按逻辑顺序排列的,而不是"iso-8859-8"传统意义上的倒退“视觉顺序”。无论如何都没有办法iconv专门处理“视觉顺序”,所以它应该很好地转换它。

至于“无效的多字节序列”,也许您将源/目标字符集参数顺序倒退了?如果这不是问题,那么您的文件可能包含未在 ISO-8859-8 字符集中定义的字节,即它是无效的......

于 2012-08-09T18:25:54.947 回答