5

似乎数组在 array_diff_uassoc中相互比较之前进行了排序。

这种方法有什么好处?

测试脚本

function compare($a, $b)
    {
    echo("$a : $b\n");
    return strcmp($a, $b);
    }

$a = array('a' => 1, 'b' => 2, 'c' => 3, 'd' => 4, 'e' => 5);
$b = array('v' => 1, 'w' => 2, 'x' => 3, 'y' => 4, 'z' => 5);
var_dump(array_diff_uassoc($a, $b, 'compare'));


$a = array('a' => 1, 'b' => 2, 'c' => 3, 'd' => 4, 'e' => 5);
$b = array('d' => 1, 'e' => 2, 'f' => 3, 'g' => 4, 'h' => 5);
var_dump(array_diff_uassoc($a, $b, 'compare'));


$a = array('a' => 1, 'b' => 2, 'c' => 3, 'd' => 4, 'e' => 5);
$b = array('a' => 1, 'b' => 2, 'c' => 3, 'd' => 4, 'e' => 5);
var_dump(array_diff_uassoc($a, $b, 'compare'));

$a = array('a' => 1, 'b' => 2, 'c' => 3, 'd' => 4, 'e' => 5);
$b = array('e' => 5, 'd' => 4, 'c' => 3, 'b' => 2, 'a' => 1);
var_dump(array_diff_uassoc($a, $b, 'compare'));

http://3v4l.org/DKgms#v526

PS似乎排序算法在php7中发生了变化。

4

2 回答 2

4

PHP 7 中的排序算法没有改变。元素只是以另一个顺序传递给排序算法以提高性能。

好吧,好处可能是最终更快的执行。当两个数组都具有完全其他键时,您确实遇到了最坏的情况。

最坏情况的复杂性是对数组进行两次排序,然后比较两个数组的每个键。O(n*m + n * log(n) + m * log(m))

最好的情况是两次排序,然后与较小数组中的元素一样多的比较。O(min(m, n) + n * log(n) + m * log(m))

在匹配的情况下,您不必再次与整个数组进行比较,而只需从匹配后的键开始。

但是在当前的实现中,排序只是多余的。我认为 php-src 中的实现需要一些改进。没有彻底的错误,但实施很糟糕。如果您了解一些 C: http: //lxr.php.net/xref/PHP_TRUNK/ext/standard/array.c#php_array_diff (请注意,该函数是通过php_array_diff(INTERNAL_FUNCTION_PARAM_PASSTHRU, DIFF_ASSOC, DIFF_COMP_DATA_INTERNAL, DIFF_COMP_KEY_USER);from调用的array_diff_uassoc

于 2015-03-04T05:22:43.907 回答
3

理论

排序允许创建一些快捷方式;例如:

A      | B
-------+------
1,2,3  | 4,5,6

A 的每个元素只会与 B[0] 进行比较,因为已知其他元素至少一样大。

另一个例子:

A      | B
-------+-------
4,5,6  | 1,2,6

在这种情况下,将 A[0] 与 B 的所有元素进行比较,但仅将 A[1] 和 A[2] 与 B[2] 进行比较。

如果 A 的任何元素大于 B 中的所有元素,您将获得最差的性能。

实践

虽然上述方法适用于标准array_diff()array_udiff(),但一旦使用关键比较函数,它将在尝试修复此错误时由于此更改而诉诸 O(n * m) 性能。

上述错误描述了自定义键比较函数在与具有混合键(即数字和字符串键值)的数组一起使用时如何导致意外结果。我个人认为这应该通过文档解决,因为你会得到同样奇怪的结果ksort()

于 2015-03-04T08:06:35.677 回答