2

我整理了一个 PHP 函数,如下所示:

function keyword_hash($keyword) {
  return base_convert(substr(md5($keyword), -16), 16, 10);
}

此函数的目的是生成可以存储在数据库中的数字哈希值,并将其用于查找(而不是尝试索引关键字列)。

MySQL中这个函数的等价物如下:

SELECT CONV(RIGHT(MD5('some keyword'), 16), 16, 10);

我已经验证了 MD5 字符串是相同的,并且 substr() 与我在 MySQL 查询中从 RIGHT() 返回的值匹配。但是,当我运行 CONV() 时,我得到的值与从 base_convert() 生成的值不同。

例如,使用keyword_hash("some keyword")生成值 10923672322315740844。但是,使用SELECT CONV(RIGHT(MD5('some keyword'), 16), 16, 10)生成 10923672322315740475,这表明最后三个数字不同。

我在这里想念什么?他们不应该产生相同的价值吗?

4

1 回答 1

3

我查看了 .php 的PHP 手册页面base_convert()。有以下警告

由于与使用的内部“double”或“float”类型相关的属性, base_convert()可能会丢失大数的精度。有关更多具体信息和限制,请参阅手册中的 浮点数部分

后来在评论中有人已经找到了解决这个问题的方法(感谢@CraigSefton):

function str_baseconvert($str, $frombase=10, $tobase=36) { 
    $str = trim($str); 
    if (intval($frombase) != 10) { 
        $len = strlen($str); 
        $q = 0; 
        for ($i=0; $i<$len; $i++) { 
            $r = base_convert($str[$i], $frombase, 10); 
            $q = bcadd(bcmul($q, $frombase), $r); 
        } 
    } 
    else $q = $str; 

    if (intval($tobase) != 10) { 
        $s = ''; 
        while (bccomp($q, '0', 0) > 0) { 
            $r = intval(bcmod($q, $tobase)); 
            $s = base_convert($r, 10, $tobase) . $s; 
            $q = bcdiv($q, $tobase, 0); 
        } 
    } 
    else $s = $q; 

    return $s; 
}

此函数使用支持任意精度数学的bc 数学库,因为它使用字符串来存储数字而不是整数/浮点数等。

于 2012-10-17T17:55:54.363 回答