0

我有这个功能可以将表情符号转换为 unicode,但它也可以将文本转换为十六进制。

如何仅转换表情符号并将文本保留为纯文本字符串?

function emoji_to_unicode($emoji) {
   $emoji = mb_convert_encoding($emoji, 'UTF-32', 'UTF-8');
   $unicode = strtoupper(preg_replace("/^[0]{3}/","U+",bin2hex($emoji)));
   return $unicode;
}

$var = ("xtext here");
$out = '';
for ($i = 0; $i < mb_strlen($var); $i++) {
    $out .= emoji_to_unicode(mb_substr($var, $i, 1));
}
echo "$out\n";

所以

$var = ("xtext here");

返回给我:

U+1F600U+00078U+1F600U+00074U+00065U+00078U+00074U+00020U+00068U+00065U+00072U+00065

但我需要这样的回报:

U+1F600xU+1F600text here

我需要将文本保留为纯文本,但也要将表情符号保留为 unicode 格式。

4

1 回答 1

1

Intl 扩展提供了处理 unicode 代码点和块的函数,这些函数允许确定当前字符是否为表情符号。

function emoji_to_unicode($emoji) {
   $emoji = mb_convert_encoding($emoji, 'UTF-32', 'UTF-8');
   $unicode = strtoupper(preg_replace("/^[0]{3}/","U+",bin2hex($emoji)));
   return $unicode;
}

$var = ("xtext here");
$out = '';
for ($i = 0; $i < mb_strlen($var); $i++) {
    $char = mb_substr($var, $i, 1);
    $isEmoji = IntlChar::getBlockCode(IntlChar::ord($char)) == IntlChar::BLOCK_CODE_EMOTICONS;
    $out .= $isEmoji ? emoji_to_unicode($char) : $char;
}

echo $out;

这是预定义常量的列表,您可以在其中找到所有块。

于 2019-08-11T23:32:17.130 回答