2

我使用 Ajax 调用来接收希伯来语的响应。结果来自不同的站点并进行了windows-1255编码。我的页面是UTF-8. 响应如下所示:

îéãò ìî÷áì  áæ÷ äçáøä äéùøàìéú  àéï 

我找到了这个网站: http: //kanjidict.stc.cx/recode.php 使用 windows-1255 到 UTF-8(+标记最后一个复选框),结果很完美。问题是我如何在 PHP 上做到这一点?

我所做的一切都会导致垃圾。

$data = 'îéãò ìî÷áì  áæ÷ äçáøä äéùøàìéú àéï  ';
echo mb_detect_encoding($data);

结果UTF-8(也许它真的是 UTF-8,因为我的 php 文件是 utf-8)

我实际上需要这个结果:

מידע למקבל  בזק החברה הישראלית אין 

如果我尝试 iconv:

echo iconv("WINDOWS-1255", "UTF-8", "îéãò ìî÷áì  áæ÷ äçáøä äéùøàìéú àéï  ");

我明白了:

ֳ®ֳ©ֳ£ֳ² ֳ¬ֳ®ֳ·ֳ¡ֳ¬ ֳ¡ֳ¦ֳ· ֳ₪ֳ§ֳ¡ֳ¸ֳ₪ ֳ₪ֳ©ֳ¹ֳ¸ֳ ֳ¬ֳ©ֳ÷ ֳ ֳ©ֳ¯ 

到底是怎么回事?我怎样才能得到希伯来语结果?

谢谢!!

4

2 回答 2

2

当您有一个包含此内容的文件时:

echo iconv("WINDOWS-1255", "UTF-8", "îéãò ìî÷áì  áæ÷ äçáøä äéùøàìéú àéï  ");

保存文件本身的编码非常重要。PHP 的字符串不关心编码,它们只是作为字节数组工作。因此,如果您使用 UTF-8 编码保存此类文件,则该字符串当然会以 UTF-8 保存,并且 iconv 无法将其从 WIN1255 转换,因为它是 UTF-8。

我的建议是 1) 从服务器检索原始编码中的字符串 2) 将其保存到文件中 3) 使用该文件进行实验,因为这样您可以确定您只处理数据。一旦您尝试将其复制并粘贴到某处,您可能会更改事物的编码。

使用十六进制编辑器查看数据也不是一个坏主意,这样您就可以确定文件中存储的内容。

无论如何,您所说的尝试做的似乎是正确的:从服务器获取 WIN-1255 数据,然后在其上调用 iconv(...),现在它是 UTF-8,将其输出到 HTML 页面(当然有一个<meta>表示它是 UTF-8 的)。

于 2012-05-01T16:36:26.243 回答
1

可能不需要重新编码。您可以简单地使用声明的 win-1255 编码提供相同的内容,并让浏览器处理它。

如果你想重新编码,你需要在服务器上这样做:

  1. 从远程服务器获取字符串。
  2. 确定字符串的编码(来自 http 标头或 html 标头)。
  3. 如有必要,将编码转换为 utf-8。
  4. 使用正确的 utf-8 编码声明向客户端返回新值。

您可能Content-Type: text/html;charset=utf8在第 4 步中遗漏了标题,这就是您echo iconv(...)看起来错误的原因。

这是一个示例函数,可以在常见情况下为您执行步骤 1-3:

function getUrlAsUtf8($url) {
    $s = file_get_contents($url);
    if ($s) {
        $contenttype = preg_grep('/content-type:(?:(?:\r\n)?[ \t]+)*+((?:(?:(?:\r\n)[ \t]+)|[ \t\x20-\x7e\x80-\xff])*)/i', $http_response_header);
        $inputcharset = null;
        foreach ($contenttype as $ct) {
            if (preg_match('/charset\s*=\s*(.*?)(?:$|;)/i', $ct, $matches)) {
                $inputcharset = strtolower($matches[1]);
            }
        }
        if ($inputcharset and $inputcharset!=='utf-8') {
            $s = mb_convert_encoding($s, 'utf-8', $inputcharset);
        }
    }
    return $s;
}

echo getUrlAsUtf8('http://example.org');
于 2012-05-01T19:17:16.413 回答