186

我有一个处理多种语言的 PHP 脚本。不幸的是,每当我尝试使用 时json_encode,任何 Unicode 输出都会转换为十六进制实体。这是预期的行为吗?有没有办法将输出转换为 UTF-8 字符?

这是我所看到的一个例子:

输入

echo $text;

输出

База данни грешка.

输入

json_encode($text);

输出

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."
4

8 回答 8

433

从 PHP/5.4.0 开始,有一个名为JSON_UNESCAPED_UNICODE. 一探究竟:

https://php.net/function.json-encode

因此,您应该尝试:

json_encode( $text, JSON_UNESCAPED_UNICODE );
于 2013-05-11T14:46:11.190 回答
61

JSON_UNESCAPED_UNICODE 在 PHP 5.4 或更高版本上可用。
以下代码适用于版本 5.3。

更新

  • html_entity_decodepack+效率高一点mb_convert_encoding
  • (*SKIP)(*FAIL)跳过反斜杠本身和JSON_HEX_*标志指定的字符。

 

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}
于 2013-05-11T15:26:35.500 回答
12

你喜欢设置字符集和未转义的 unicode

 header('Content-Type: application/json;charset=utf-8');  
 json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);
于 2018-09-25T17:11:14.453 回答
6

一种解决方案是首先对数据进行编码,然后在同一个文件中对其进行解码:

$string =json_encode($input, JSON_UNESCAPED_UNICODE) ; 
echo $decoded = html_entity_decode( $string );
于 2018-05-03T21:45:17.563 回答
2

这是我针对各种 PHP 版本的组合解决方案。

在我的公司,我们正在使用具有各种 PHP 版本的不同服务器,因此我必须找到适合所有人的解决方案。

$phpVersion = substr(phpversion(), 0, 3)*1;

if($phpVersion >= 5.4) {
  $encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
  $encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}

学分应该去Marco Gasi & abu。json_encode 文档中提供了 PHP >= 5.4 的解决方案。

于 2019-04-29T12:56:55.723 回答
1
json_encode($text, JSON_UNESCAPED_UNICODE|JSON_UNESCAPED_SLASHES);
于 2019-04-02T17:30:52.687 回答
-2

上面的 raw_json_encode() 函数没有解决我的问题(由于某种原因,回调函数在我的 PHP 5.2.5 服务器上引发了错误)。

但是这个其他解决方案确实有效。

https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html

学分应该去Marco Gasi。我只是调用他的函数而不是调用 json_encode():

function jsonRemoveUnicodeSequences( $json_struct )
{ 
    return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}
于 2019-01-18T17:08:35.020 回答
-6

这是预期的行为吗?

唯一json_encode()适用于 UTF-8 编码的数据。

也许你可以在这里得到一个转换它的答案:cyrillic-characters-in-phps-json-encode

于 2013-05-11T15:33:20.317 回答