我正在尝试找到一种干净的方法来使用 php 解码一些“特殊字符”,我有一个 RTF 文件(还有 PDF 和 DOC 有理智的问题),我设法打开它并在其中找到明文,放在结束它仍然会输出一些字符,例如:é 为 é 或 ç 为 ç。我尝试过 mb_detect_encoding(也使用“auto”)但它检测到“ACSII”,我尝试使用 mb_convert_encoding($mytext,'ISO-8859-1'), mb_convert_encoding($mytext,'ISO-8859-15' ), mb_convert_encoding($mytext,'UTF-8') 然后 UTF-8 到 ISO-8859-1, htmlspecialchars, utf8_decode (递归)。我制作了一个映射表,但我认为这不是最好的方法吗?
泽维尔·维兰
PS:大部分文件都是用法国拉丁字符集创建的。