3

让我们说字符串是

$uni_str="06280628002006280628";

在阿拉伯语中,它是: بب بب

那么,如何在不使用 html 的情况下将其转换为 php:

    for($i=0; $i<strlen($uni_str); $i+=4)
    {
        $text_str .= "&#x".substr($uni_str,$i,4).";";
    }

因为这段代码只是解决了在 html 页面中查看结果的问题,

但我想但结果在 php 变量中。

由于上面代码的结果就像

&#x0628;&#x0628;&#x0020;&#x0020;&#x0628;&#x0628;
4

3 回答 3

2

我找到了解决方案,希望对您有所帮助:

function uni2arabic($uni_str) 
{   
      for($i=0; $i<strlen($uni_str); $i+=4)
         {
                $new="&#x".substr($uni_str,$i,4).";"; 
                $txt = html_entity_decode("$new", ENT_COMPAT, "UTF-8");
                $All.=$txt;
         }

    return $All;
} 

变量 $All 包含阿拉伯字符串

于 2013-04-11T16:33:07.160 回答
1

用于hex2bin将十六进制解码为字节序列,然后您可以将每对字节解包为 UTF-16 代码单元(我假设您的字符串代表的内容)。

假设您正在生成 UTF-8 文本输出:

iconv('UTF-16BE', 'UTF-8', hex2bin('06280628002006280628'))
于 2013-04-10T17:46:54.977 回答
0

以下代码允许您解码字符以及在必要时重新编码它们

代码

if (!function_exists('codepoint_encode')) {

    function codepoint_encode($str) {
        return substr(json_encode($str), 1, -1);
    }

}

if (!function_exists('codepoint_decode')) {

    function codepoint_decode($str) {
        return json_decode(sprintf('"%s"', $str));
    }

}

如何使用

header('Content-Type: text/html; charset=utf-8'); 

var_dump(codepoint_encode('ඔන්ලි'));
var_dump(codepoint_encode('සින්ග්ලිෂ්'));

var_dump(codepoint_decode('\u0d94\u0db1\u0dca\u0dbd\u0dd2'));
var_dump(codepoint_decode('\u0dc3\u0dd2\u0db1\u0dca\u0d9c\u0dca\u0dbd\u0dd2\u0dc2\u0dca'));

输出

string(30) "\u0d94\u0db1\u0dca\u0dbd\u0dd2"
string(60) "\u0dc3\u0dd2\u0db1\u0dca\u0d9c\u0dca\u0dbd\u0dd2\u0dc2\u0dca"
string(15) "ඔන්ලි"
string(30) "සින්ග්ලිෂ්"

如果您想要更复杂的功能,请参阅如何从 PHP 中的 unicode 代码点获取字符?.

于 2014-07-15T17:04:17.673 回答