6

是否有任何形式可以将 Java Escape 中的字符串转换为 PHP 中的索引 unicode?

我有这个字符串:

$ str = "\ud83d\ude0e";

我需要获得 U+ 之后的部分:

U+1F60E 

或者python代码:

u'\U0001f60e'

对应代码: http: //www.charbase.com/1f60e-unicode-smiling-face-with-sunglasses

谢谢你。

==== 编辑 09/03 ====

对不起,我的延误,感谢您的回复,但我无法做我需要的。

我需要用图像替换字符,所以我这样做:

$src = "Hello "."\ud83d\ude0e";

$replaced = preg_replace("/\\\\u([0-9A-F]{1,8})/i", "&#x$1;", $src);

$replaced = str_replace('&#x1f60e', '<img src="data/emoji_new/1F60E.png">', $replaced);

$result = mb_convert_encoding($replaced, "UTF-8", "HTML-ENTITIES");

但是,不起作用..结果是:

"Hello ��"

还有什么想法吗??

再次感谢你!

4

1 回答 1

2

非常类似于PHP:Convert unicode codepoint to UTF-8

如果可以的话,直接从 4 字节字符开始。

$src = "Hello \u0001f60e";

$replaced = preg_replace("/\\\\u([0-9A-F]{1,8})/i", "&#x$1;", $src);

$result = mb_convert_encoding($replaced, "UTF-8", "HTML-ENTITIES");

echo "Result is [$result] and string length is ".mb_strlen($result);

输出几乎可以肯定不会在大多数人的浏览器中正确显示的内容。

Result is [Hello ] and string length is 10

或者来自两个 UTF-16 代码:

$src = "Hello "."\ud83d\ude0e";

$replaced = preg_replace("/\\\\u([0-9A-F]{1,4})/i", "&#x$1;", $src);

$result = mb_convert_encoding($replaced, "UTF-16", "HTML-ENTITIES");

$result = mb_convert_encoding($result, 'utf-8', 'utf-16');

echo "Result is [$result] and string length is ".mb_strlen($result)."\n";

$resultInHex = unpack('H*', $result);

$resultInHex = $resultInHex[1];

$resultSeparated = implode(', ', str_split($resultInHex, 2));

echo "in hex: ".$resultSeparated;

输出:

Result is [Hello ] and string length is 10
in hex: 48, 65, 6c, 6c, 6f, 20, f0, 9f, 98, 8e

对于想知道“什么是 Java 转义?”的每个人,Java 在内部将所有字符编码为 UTF-16。

于 2013-03-01T15:18:35.010 回答