我目前正在计算一组数据的唯一排列。虽然以下代码正在运行,但它并没有我想要的那么高效。一旦我得到超过 6 或 8 个项目,它就会变得非常慢,并且我开始遇到内存问题。
这是代码和解释
<?php
function permuteUnique($items, $count = false, $perms = [], &$return = []) {
if ($count && count($return) == $count) return $return;
if (empty($items)) {
$duplicate = false;
foreach ($return as $a) {
if ($a === $perms) {
$duplicate = true;
break;
}
}
if (!$duplicate) $return[] = $perms;
} else {
for ($i = count($items) - 1; $i >= 0; --$i) {
$newitems = $items;
$newperms = $perms;
list($tmp) = array_splice($newitems, $i, 1);
array_unshift($newperms, $tmp);
permuteUnique($newitems, $count, $newperms, $return);
}
return $return;
}
}
function factorial($n) {
$f = 1;
for ($i = 2; $i <= $n; $i++) $f *= $i;
return $f;
}
给定输入[1, 1, 2]
,我按预期收到以下输出
array (size=3)
0 =>
array (size=3)
0 => int 1
1 => int 1
2 => int 2
1 =>
array (size=3)
0 => int 1
1 => int 2
2 => int 1
2 =>
array (size=3)
0 => int 2
1 => int 1
2 => int 1
该$count
参数是为了让我可以将我期望的唯一排列的数量传递给函数,一旦发现很多,它就可以停止计算并返回数据。这计算为项目总数的阶乘除以所有重复计数的阶乘的乘积。我不确定我说得对,所以让我举个例子。
给定集合[1, 2, 2, 3, 4, 4, 4, 4]
,唯一排列的计数计算为
8! / (2!4!) = 840
因为总共有 8 个项目,其中一个重复两次,另一个重复 4 次。
现在,如果我将其转换为 php 代码...
<?php
$set = [1, 2, 2, 3, 4, 4, 4, 4];
$divisor = 1;
foreach (array_count_values($set) as $v) {
$divisor *= factorial($v);
}
$count = factorial(count($set)) / $divisor;
$permutations = permuteUnique($set, $count);
这很慢。如果我在函数中添加一个计数器permuteUnique
,它会运行超过 100k 次,然后才能找到 840 个唯一排列。
我想找到一种方法来减少这种情况并找到通往唯一排列的最短路径。感谢您提供的任何帮助或建议。