1

我正在制作一个应用程序,当聊天将从 iOS 应用程序发送时,但管理员可以从 PHP 内置的管理面板查看聊天。

从 DB,我会收到这样的聊天消息:

Hi, Jax\ud83d\ude1b\ud83d\ude44! can we go for a coffee?

我正在使用可以将 HEX 代码点转换为图像的twemoji库。

详细说一下,

在 php 部分,我有以下代码: -

$text = "This is fun \u1f602! \u1f1e8 ";
$html = preg_replace("/\\\\u([0-9A-F]{2,5})/i", "&#x$1;", $text);
echo $html;

现在,twemoji 解析 HTML 文档的整个正文以将 Hex 代码点替换为图像。

window.onload = function() {

  // Set the size of the rendered Emojis
  // This can be set to 16x16, 36x36, or 72x72
  twemoji.size = '16x16';

  // Parse the document body and
  // insert <img> tags in place of Unicode Emojis
  twemoji.parse(document.body);
}

所以,我需要文本将所有 UTF-16 替换为 HEX 代码点(用于表情符号)。 我怎样才能做到这一点?

4

1 回答 1

0

这里有一个双重问题:

  • 检测到有一个代理对编码
  • 实际上将该代理对转换为 HTML 实体

解释问题的复杂性远远超出了单个答案的范围(您必须为此阅读 UTF-16),但此代码片段似乎可以解决您的问题:

$text = "Hi, Jax\\ud83d\\ude1b\\ud83d\\ude44! can we go for a coffee?";

$result = preg_replace_callback('/\\\\u(d[89ab][0-9a-f]{2})\\\\u(d[c-f][0-9a-f]{2})/i', function ($matches) {
    $first = $matches[1];
    $second = $matches[2];
    $value = ((eval("return 0x$first;") & 0x3ff) << 10) | (eval("return 0x$second;") & 0x3ff);
    $value += 0x10000;
    return "&#$value;";
  }, $text);

echo $result;

我知道eval几乎总是不鼓励使用,但在这个例子中它是完全安全的,因为正则表达式匹配(你知道匹配只包含十六进制数字)。

于 2016-08-30T13:36:15.017 回答