4

我正在尝试从字符串中提取压缩的十六进制数字。我的应用程序正在与一个服务器通信,该服务器发送一个带有标头的字符串,后跟 2 字节打包的十六进制数字。这个字符串中有数千个数字。

我想要做的是提取每个 2 字节压缩数字,并将其转换为我可以用来执行计算的数字。

示例:string = "info:\x00\x00\x11\x11\x22\x22"将产生三个数字0x0000(十进制 0)、0x1111(十进制 4369)、0x2222(十进制 8738)

我有一个可行的解决方案(见下文),但是当我尝试处理服务器发送的数千个数字时,它的运行速度太慢了。请提供一些建议以加快我的方法。

//Works but is too slow!
//$string has the data from the server
$arrayIndex = 0;
for($index = [start of data]; $index < strlen($string); $index+=2){
    $value = getNum($string, $index, $index+1);
    $array[$arrayIndex++] = $value;
}
function getNum($string, $start, $end){
    //get the substring we're interested in transforming
    $builder = substr($string, $start, $end-$start+1);  

    //convert into hex string
    $array = unpack("H*data", $builder);
    $answer = $array["data"];

    //return the value as a number
    return hexdec($answer);
}

我也一直在尝试在单个解包命令中提取数字,但这不起作用(我在理解要使用的格式字符串时遇到了一些麻烦)

//Not working alternate method
//discard the header (in this case 18 bytes) and put the rest of the
//number values I'm interested in into an array
$unpacked = unpack("c18char/H2*data", $value);
for($i = 0; $i < $size; $i+=1){
    $data = $unpacked["data".$i];
    $array[$i] = $data;
}
4

3 回答 3

2
$array = array();
$len = strlen($string);
for($index = [start of data];          $index < $len;               $index+=2){
    $d = unpack("H*data", substr($string, $index, 2));
    $array[] = hexdec($d["data"]);
}

我做的唯一重要的事情是缓存 strlen 的值并减少函数调用。

你也可以试试这个

foreach (str_split(substr($string, [start of data]), 2) as $chunk) {
    $d = unpack("H*data", $chunk);
    $array[] = hexdec($d["data"]);
}
于 2012-06-29T18:30:52.923 回答
1

我可以建议的一件事是通过引用传递包含数千个十六进制数字的字符串,而不是值。如果假设有 3k 个数字,则字符串是 12k 长字符,3k 函数调用的倍数导致 ~36M(如果每个字符使用一个字节,则 ~72M 如果 utf8)堆栈上不必要的分配内存:

$arrayIndex = 0;
for($index = [start of data]; $index < strlen($string); $index+=2){
    $value = getNum($string, $index, $index+1);
    $array[$arrayIndex++] = $value;
}
 //pass by reference rather than value
function getNum(&$string, $start, $end){
    //get the substring we're interested in transforming
    //$builder = substr($string, $start, $end-$start+1);  
    //not sure if substr takes reference or value, so implementing this way, just in case it's by value
      $builder = $string[$start] . $string[$start + 1] ;
    //convert into hex string
    $array = unpack("H*data", $builder);
    $answer = $array["data"];

    //return the value as a number
    return hexdec($answer);
}

不确定这会加快多少速度(肯定是内存分配),但绝对值得一试。

于 2012-06-29T18:18:28.567 回答
0

为什么不尝试类似的东西:

$string = "info:\x00\x00\x11\x11\x22\x22";

$ret = array();
preg_match_all('#\\x(\d{2})#', $string, $items);
if(isset($items[1]) && count($items[1])>0)
{
     for($i=0;$i<count($items[1]);$i+=2)
     {
            if(isset($items[1][$i]) && isset($items[1][$i+1]))
            {
                    $ret[] = '0x' . $items[1][$i] . $items[1][$i+1];
                    unset($items[1][$i]);
                    unset($items[1][$i+1]);
            }
     }
}
于 2012-06-29T18:19:39.783 回答