0

我有一个从 USB 调制解调器设备返回的 GSM-7 字符串,其中包含 UTF-16 编码字符串。示例字符串是“007A006E0061006B006F007600690020010D0107017E0020006800610068006100730068”。

我需要一个 PHP 解决方案(函数)将字符串从 UTF-16(小端序)转换为 UTF-8(人类可读格式)。从上面的字符串翻译应该是这个“znakovi čćž haha​​sh”。我花了几个小时寻找合适的解决方案,但没有成功。我尝试使用带有许多不同选项的 iconv 和 mb_convert_encoding,但我没有得到想要的结果。我找到了一个在线服务来转换字符串,这里是打印屏幕https://prnt.sc/v09r57

先感谢您

4

3 回答 3

0

以下代码片段可能会有所帮助(我是php菜鸟,所以自己制作一个函数;也许您需要安装或启用 PHP 扩展intl):

<?php
$strinput = "007A006E0061006B006F007600690020010D0107017E0020006800610068006100730068";
print "$strinput\n";

$stroutput = '';
for ( $i = 0; $i < strlen($strinput); $i += 4 ) {
    $stroutput .= IntlChar::chr(hexdec( substr( $strinput,$i,4)));
};

print $stroutput;
?>

输出.\SO\64382302.php

007A006E0061006B006F007600690020010D0107017E0020006800610068006100730068
znakovi čćž hahash
于 2020-10-16T10:34:40.007 回答
0

那是 UTF-16BE(最重要的位在前),而不是 LE(另请参见UTF-16 示例)。

// Hexadecimal text: each 2 characters describe 1 byte
$sText= '007A006E0061006B006F007600690020010D0107017E0020006800610068006100730068';

// Actually forming bytes of that text, i.e. making '7A' a 'z' and '20' a ' '
$sUtf16= pack( 'H*', $sText );

如果你真的需要 UTF-8:

// Since we now have an actual encoding: convert it to the wanted one
$sUtf8= mb_convert_encoding( $sUtf16, 'UTF-8', 'UTF-16BE' );

// To make sure the consumer interpretes the data correctly
header( 'Content-type: text/plain; charset=UTF-8' );
echo $sUtf8;

但是如果客户端无论如何都能够处理不同的编码(例如互联网浏览器),您可以立即输出 UTF-16BE:

header( 'Content-type: text/html; charset=UTF-16BE' );
echo $sUtf16;

此代码甚至可以与 PHP5 一起使用,并且不需要额外的扩展。

于 2020-10-18T19:23:21.417 回答
-1

几天前我已经找到了更简单的解决方案,效果很好。如果有人需要使用:

    $string="007A006E0061006B006F007600690020010D0107017E0020006800610068006100730068";
    $packed = pack('H*', $string);
    echo iconv("UTF-16BE","UTF-8",$packed);

谢谢大家的回复。

于 2020-10-18T23:05:18.407 回答