6

假设我有两个列表,我如何遍历每个子列表的所有可能组合,以使每个项目出现一次且仅出现一次。

我想一个例子可能是,如果您有员工和工作,并且您希望将它们分成团队,每个员工只能在一个团队中,每个工作只能在一个团队中。例如

List<string> employees = new List<string>() { "Adam", "Bob"}  ;
List<string> jobs      = new List<string>() { "1", "2", "3"};

我想

Adam       : 1
Bob        : 2 , 3

Adam       : 1 , 2
Bob        : 3

Adam       : 1 , 3
Bob        : 2

Adam       : 2 
Bob        : 1 , 3

Adam       : 2 , 3
Bob        : 1

Adam       : 3
Bob        : 1 , 2

Adam, Bob  : 1, 2, 3

我尝试使用这个stackoverflow问题的答案来生成每个可能的员工组合和每个可能的工作组合的列表,然后从每个列表中选择一个项目,但这就是我所得到的。

我不知道列表的最大大小,但肯定会小于 100,并且可能还有其他限制因素(例如每个团队最多可以有 5 名员工)

更新

不确定这是否可以进一步整理和/或简化,但这是我到目前为止的最终结果。

它使用 Yorye 提供的 Group 算法(请参阅下面的答案),但我删除了我不需要的 orderby,如果密钥不可比较,则会导致问题。

var employees = new List<string>() { "Adam", "Bob"  } ;
var jobs      = new List<string>() { "1", "2", "3"  };

int c= 0;
foreach (int noOfTeams in Enumerable.Range(1, employees.Count))
{   
    var hs = new HashSet<string>();

    foreach( var grouping in Group(Enumerable.Range(1, noOfTeams).ToList(), employees))
    {   
        // Generate a unique key for each group to detect duplicates.   
        var key = string.Join(":" , 
                      grouping.Select(sub => string.Join(",", sub)));           

        if (!hs.Add(key))
            continue;

        List<List<string>> teams = (from r in grouping select r.ToList()).ToList();

        foreach (var group in Group(teams, jobs))
        {
            foreach (var sub in group)
            {               
                Console.WriteLine(String.Join(", " , sub.Key )   + " : " + string.Join(", ", sub));
            }
            Console.WriteLine();
            c++;
        }
    }

}           
Console.WriteLine(String.Format("{0:n0} combinations for {1} employees and {2} jobs" , c , employees.Count, jobs.Count));  

由于我不担心结果的顺序,这似乎给了我我需要的东西。

4

5 回答 5

5

好问题。

首先,在你写下你的代码之前,让我们了解你的问题的基本组合。

基本上,您要求对于集合 A 的任何分区,您需要集合 B 中相同数量的部分。

例如,如果您将集合 A 拆分为 3 个组,则您需要将集合 B 也拆分为 3 个组,如果您不这样做,则至少一个元素在另一组中不会有相应的组。
将集合 A 拆分为 1 组更容易描绘,我们必须有一组由集合 B 组成,如您的示例 (Adam, Bob : 1, 2, 3) 。

所以现在,我们知道集合 A 有n 个元素,集合 B 有k个元素。
所以自然我们不能要求任何集合被分割得更多Min(n,k)

假设我们将两个集合分成 2 个组(分区),现在我们1*2=2!在两个集合之间有了唯一的对。
另一个例子是 3 个组,每个组都会给我们1*2*3=3!独特的配对。

但是,我们还没有完成,在将任何集合拆分为几个子集(组)之后,我们仍然可以对元素进行多种组合排序。
因此,对于m集合的分区,我们需要找出在分区中放置n元素的组合数量。这可以通过使用第二类公式的斯特林数找到:m


(等式 1)第二类斯特林数

这个公式为您提供了将一组n元素划分k为非空集的方法的数量。

因此,从 1 到所有分区的对组合的总数min(n,k)为:(

等式 2)所有组合

简而言之,它是两个集合的所有分区组合的总和,乘以所有对的组合。

所以现在我们了解了如何对数据进行分区和配对,我们可以写下代码:

代码:

所以基本上,如果我们看一下我们的最终等式(2),我们就会明白我们需要四部分代码来解决我们的问题。
1. 求和(或循环)
2. 从两个集合中获取我们的斯特林集或分区
的方法 3. 获取两个斯特林集的笛卡尔积的方法。
4. 一种对集合中的项目进行置换的方法。(嗯!)

在 StackOverflow 上,您可以找到许多方法来排列项目以及如何查找笛卡尔积,这是一个示例(作为扩展方法):

 public static IEnumerable<IEnumerable<T>> Permute<T>(this IEnumerable<T> list)
    {
        if (list.Count() == 1)
            return new List<IEnumerable<T>> { list };

        return list.Select((a, i1) => Permute(list.Where((b, i2) => i2 != i1)).Select(b => (new List<T> { a }).Union(b)))
                   .SelectMany(c => c);
    }

这是代码中最简单的部分。
更困难的部分(恕我直言)是找到n一组所有可能的分区。
所以为了解决这个问题,我首先解决了如何找到集合中所有可能的分区(不仅仅是大小为 n)的更大问题。

我想出了这个递归函数:

public static List<List<List<T>>> AllPartitions<T>(this IEnumerable<T> set)
    {
        var retList = new List<List<List<T>>>();

        if (set == null || !set.Any())
        {
            retList.Add(new List<List<T>>());
            return retList;
        }
        else
        {
            for (int i = 0; i < Math.Pow(2, set.Count()) / 2; i++)
            {
                var j = i;

                var parts = new [] { new List<T>(), new List<T>() };


                foreach (var item in set)
                {
                    parts[j & 1].Add(item);
                    j >>= 1;
                }

                foreach (var b in AllPartitions(parts[1]))
                {
                    var x = new List<List<T>>();

                    x.Add(parts[0]);

                    if (b.Any())
                        x.AddRange(b);

                    retList.Add(x);
                }
            }
        }
        return retList;
    }

: 的返回值List<List<List<T>>>仅表示所有可能分区的列表,其中分区是集合列表,集合是元素列表。
我们在这里不必使用 List 类型,但它简化了索引。

所以现在让我们把所有东西放在一起:

主要代码

//Initialize our sets
        var employees = new [] { "Adam", "Bob" };
        var jobs = new[] {  "1", "2", "3" };

        //iterate to max number of partitions (Sum)
        for (int i = 1; i <= Math.Min(employees.Length, jobs.Length); i++)
        {
            Debug.WriteLine("Partition to " + i + " parts:");

            //Get all possible partitions of set "employees" (Stirling Set)
            var aparts = employees.AllPartitions().Where(y => y.Count == i);
            //Get all possible partitions of set "jobs" (Stirling Set)
            var bparts = jobs.AllPartitions().Where(y => y.Count == i);

            //Get cartesian product of all partitions 
            var partsProduct = from employeesPartition in aparts
                      from jobsPartition in bparts
                               select new {  employeesPartition,  jobsPartition };

            var idx = 0;
            //for every product of partitions
            foreach (var productItem in partsProduct)
            {
                //loop through the permutations of jobPartition (N!)
                foreach (var permutationOfJobs in productItem.jobsPartition.Permute())
                {
                    Debug.WriteLine("Combination: "+ ++idx);

                    for (int j = 0; j < i; j++)
                    {
                        Debug.WriteLine(productItem.employeesPartition[j].ToArrayString() + " : " + permutationOfJobs.ToArray()[j].ToArrayString());
                    }
                }
            }
        }

输出:

Partition to 1 parts:
Combination: 1
{ Adam , Bob } : { 1 , 2 , 3 }
Partition to 2 parts:
Combination: 1
{ Bob } : { 2 , 3 }
{ Adam } : { 1 }
Combination: 2
{ Bob } : { 1 }
{ Adam } : { 2 , 3 }
Combination: 3
{ Bob } : { 1 , 3 }
{ Adam } : { 2 }
Combination: 4
{ Bob } : { 2 }
{ Adam } : { 1 , 3 }
Combination: 5
{ Bob } : { 3 }
{ Adam } : { 1 , 2 }
Combination: 6
{ Bob } : { 1 , 2 }
{ Adam } : { 3 }

我们可以通过计算结果轻松检查我们的输出。
在这个例子中,我们有一组 2 个元素和一组 3 个元素,等式 2 表明我们需要 S(2,1)S(3,1)1!+S(2,2)S(3,2 )2!= 1+6 = 7
这正是我们得到的组合数。

这里是第二类斯特林数的例子供参考:
S(1,1) = 1

S(2,1) = 1
S(2,2) = 1

S(3,1) = 1
S(3,2) = 3
S(3,3) = 1

S(4,1) = 1
S(4,2) = 7
S(4,3) = 6
S(4,4) = 1

编辑 19.6.2012

public static String ToArrayString<T>(this IEnumerable<T> arr)
    {
        string str = "{ ";

        foreach (var item in arr)
        {
            str += item + " , ";
        }

        str = str.Trim().TrimEnd(',');
        str += "}";

        return str;
    }

编辑 24.6.2012

该算法的主要部分是寻找斯特林集,我使用了一种低效的 Permutation 方法,这里有一个基于 QuickPerm 算法的更快的方法:

public static IEnumerable<IEnumerable<T>> QuickPerm<T>(this IEnumerable<T> set)
    {
        int N = set.Count();
        int[] a = new int[N];
        int[] p = new int[N];

        var yieldRet = new T[N];

        var list = set.ToList();

        int i, j, tmp ;// Upper Index i; Lower Index j
        T tmp2;

        for (i = 0; i < N; i++)
        {
            // initialize arrays; a[N] can be any type
            a[i] = i + 1; // a[i] value is not revealed and can be arbitrary
            p[i] = 0; // p[i] == i controls iteration and index boundaries for i
        }
        yield return list;
        //display(a, 0, 0);   // remove comment to display array a[]
        i = 1; // setup first swap points to be 1 and 0 respectively (i & j)
        while (i < N)
        {
            if (p[i] < i)
            {
                j = i%2*p[i]; // IF i is odd then j = p[i] otherwise j = 0

                tmp2 = list[a[j]-1];
                list[a[j]-1] = list[a[i]-1];
                list[a[i]-1] = tmp2;

                tmp = a[j]; // swap(a[j], a[i])
                a[j] = a[i];
                a[i] = tmp;

                //MAIN!

               // for (int x = 0; x < N; x++)
                //{
                //    yieldRet[x] = list[a[x]-1];
                //}
                yield return list;
                //display(a, j, i); // remove comment to display target array a[]

                // MAIN!

                p[i]++; // increase index "weight" for i by one
                i = 1; // reset index i to 1 (assumed)
            }
            else
            {
                // otherwise p[i] == i
                p[i] = 0; // reset p[i] to zero
                i++; // set new index value for i (increase by one)
            } // if (p[i] < i)
        } // while(i < N)
    }

这将把时间减半。
但是,大部分 CPU 周期都用于字符串构建,这是本示例特别需要的。
这将使它更快一点:

             results.Add(productItem.employeesPartition[j].Aggregate((a, b) => a + "," + b) + " : " + permutationOfJobs.ToArray()[j].Aggregate((a, b) => a + "," + b));

在 x64 中编译会更好,因为这些字符串会占用大量内存。

于 2012-06-13T06:16:55.827 回答
3

你可以使用另一个库吗?是一个用于组合的通用库(您显然想要一个没有重复的库)。然后你只需要对你的员工列表做一个 foreach 并运行两者的组合。

从大 O 的角度来看,我不认为您对自己有任何好处,效率是这里的优先事项吗?

这是从臀部开始的,但这应该是获得你想要的东西的代码(使用那个库):

Combinations<string> combinations = new Combinations<string>(jobs, 2);

foreach(IList<string> c in combinations) {
  Console.WriteLine(String.Format("{{{0} {1}}}", c[0], c[1]));
}

然后需要将其应用于每个员工

于 2012-06-04T20:09:53.143 回答
1

在我的回答中,我将忽略您的最后一个结果: Adam, Bob: 1, 2, 3,因为它在逻辑上是一个例外。跳到最后看看我的输出。

解释:

这个想法将是迭代“元素将属于哪个组”的组合。

假设您有元素“a,b,c”,并且您有组“1, 2”,让我们有一个大小为 3 的数组作为元素的数量,它将包含组“1, 2”的所有可能组合, 重复:

{1, 1, 1} {1, 1, 2} {1, 2, 1} {1, 2, 2}
{2, 1, 1} {2, 1, 2} {2, 2, 1} {2, 2, 2}

现在我们将取出每个组,并使用以下逻辑从中制作一个键值集合:

Group ofelements[i]将是 的值comb[i]

Example with {1, 2, 1}:
a: group 1
b: group 2
c: group 1

And in a different view, the way you wanted it:
group 1: a, c
group 2: b

毕竟,您只需过滤所有不包含所有组的组合,因为您希望所有组至少具有一个值。

因此,您应该检查所有组是否以某种组合出现并过滤不匹配的组,因此您将得到:

{1, 1, 2} {1, 2, 1} {1, 2, 2}
{2, 1, 2} {2, 2, 1} {2, 1, 1}

这将导致:

1: a, b
2: c

1: a, c
2: b

1: a
2: b, c

1: b
2: a, c

1: c
2: a, b

1: b, c
2: a

这种破组的组合逻辑也适用于更多的元素和组。这是我的实现,它可能可以做得更好,因为即使我在编码时也有点迷失(这真的不是一个直观的问题,呵呵),但它工作得很好。

执行:

public static IEnumerable<ILookup<TValue, TKey>> Group<TKey, TValue>
    (List<TValue> keys,
     List<TKey> values,
     bool allowEmptyGroups = false)
{
    var indices = new int[values.Count];
    var maxIndex = values.Count - 1;
    var nextIndex = maxIndex;
    indices[maxIndex] = -1;

    while (nextIndex >= 0)
    {
        indices[nextIndex]++;

        if (indices[nextIndex] == keys.Count)
        {
            indices[nextIndex] = 0;
            nextIndex--;
            continue;
        }

        nextIndex = maxIndex;

        if (!allowEmptyGroups && indices.Distinct().Count() != keys.Count)
        {
            continue;
        }

        yield return indices.Select((keyIndex, valueIndex) =>
                                    new
                                        {
                                            Key = keys[keyIndex],
                                            Value = values[valueIndex]
                                        })
            .OrderBy(x => x.Key)
            .ToLookup(x => x.Key, x => x.Value);
    }
}

用法:

var employees = new List<string>() { "Adam", "Bob"};
var jobs      = new List<string>() { "1", "2", "3"};
var c = 0;

foreach (var group in CombinationsEx.Group(employees, jobs))
{
    foreach (var sub in group)
    {
        Console.WriteLine(sub.Key + ": " + string.Join(", ", sub));
    }

    c++;
    Console.WriteLine();
}

Console.WriteLine(c + " combinations.");

输出:

Adam: 1, 2
Bob: 3

Adam: 1, 3
Bob: 2

Adam: 1
Bob: 2, 3

Adam: 2, 3
Bob: 1

Adam: 2
Bob: 1, 3

Adam: 3
Bob: 1, 2

6 combinations.

更新

组合键组合原型:

public static IEnumerable<ILookup<TKey[], TValue>> GroupCombined<TKey, TValue>
    (List<TKey> keys,
     List<TValue> values)
{
    // foreach (int i in Enumerable.Range(1, keys.Count))
    for (var i = 1; i <= keys.Count; i++)
    {
        foreach (var lookup in Group(Enumerable.Range(0, i).ToList(), keys))
        {
            foreach (var lookup1 in
                     Group(lookup.Select(keysComb => keysComb.ToArray()).ToList(),
                           values))
            {
                yield return lookup1;
            }
        }
    }

    /*
    Same functionality:

    return from i in Enumerable.Range(1, keys.Count)
           from lookup in Group(Enumerable.Range(0, i).ToList(), keys)
           from lookup1 in Group(lookup.Select(keysComb =>
                                     keysComb.ToArray()).ToList(),
                                 values)
           select lookup1;
    */
}

仍然存在重复的小问题,但它会产生所有结果。

这是我用来删除重复项的方法,作为临时解决方案

var c = 0;
var d = 0;

var employees = new List<string> { "Adam", "Bob", "James" };
var jobs = new List<string> {"1", "2"};

var prevStrs = new List<string>();

foreach (var group in CombinationsEx.GroupCombined(employees, jobs))
{
    var currStr = string.Join(Environment.NewLine,
                              group.Select(sub =>
                                           string.Format("{0}: {1}",
                                               string.Join(", ", sub.Key),
                                               string.Join(", ", sub))));

    if (prevStrs.Contains(currStr))
    {
        d++;
        continue;
    }

    prevStrs.Add(currStr);

    Console.WriteLine(currStr);
    Console.WriteLine();
    c++;
}

Console.WriteLine(c + " combinations.");
Console.WriteLine(d + " duplicates.");

输出:

Adam, Bob, James: 1, 2

Adam, Bob: 1
James: 2

James: 1
Adam, Bob: 2

Adam, James: 1
Bob: 2

Bob: 1
Adam, James: 2

Adam: 1
Bob, James: 2

Bob, James: 1
Adam: 2

7 combinations.
6 duplicates.

请注意,它还将生成非组合组(如果可能 - 因为不允许空组)。要仅生成组合键,您需要替换它:

for (var i = 1; i <= keys.Count; i++)

有了这个:

for (var i = 1; i < keys.Count; i++)

在 GroupCombined 方法的开头。用三名员工和三份工作测试该方法,看看它是如何工作的。

另一个编辑:

更好的重复处理将在 GroupCombined 级别处理重复的组合键:

public static IEnumerable<ILookup<TKey[], TValue>> GroupCombined<TKey, TValue>
    (List<TKey> keys,
     List<TValue> values)
{
    for (var i = 1; i <= keys.Count; i++)
    {
        var prevs = new List<TKey[][]>();

        foreach (var lookup in Group(Enumerable.Range(0, i).ToList(), keys))
        {
            var found = false;
            var curr = lookup.Select(sub => sub.OrderBy(k => k).ToArray())
                .OrderBy(arr => arr.FirstOrDefault()).ToArray();

            foreach (var prev in prevs.Where(prev => prev.Length == curr.Length))
            {
                var isDuplicate = true;

                for (var x = 0; x < prev.Length; x++)
                {
                    var currSub = curr[x];
                    var prevSub = prev[x];

                    if (currSub.Length != prevSub.Length ||
                        !currSub.SequenceEqual(prevSub))
                    {
                        isDuplicate = false;
                        break;
                    }
                }

                if (isDuplicate)
                {
                    found = true;
                    break;
                }
            }

            if (found)
            {
                continue;
            }

            prevs.Add(curr);

            foreach (var group in
                     Group(lookup.Select(keysComb => keysComb.ToArray()).ToList(),
                           values))
            {
                yield return group;
            }
        }
    }
}

看起来,给方法添加约束是很聪明的,这样也可能TKey是.ICompareable<TKey>IEquatable<TKey>

这最终导致 0 个重复。

于 2012-06-06T12:18:03.527 回答
0

假设我们有两个集合,A 和 B。
A = {a1, a2, a3} ; B = {b1, b2, b3}

首先,让我们得到一个由包含子集的元组及其补集组成的集合:

{a1} {a2 a3} 
{a2} {a1 a3}
{a3} {a1 a2}
{a2, a3} {a1}
...

为此,您可以使用上面的 Rikon 库,或编写自己的代码。你需要这样做:

  1. 获取所有子集的集合(称为幂集)
  2. 对于每个子集,从更大的集合中获取该子集的补集或剩余元素。
  3. 将它们加入一个元组或对;例如(子集,补码)

这里的订单很重要;{a1} {a2 a3} and {a2 a3} {a1}毕竟是不同的元组。

然后我们为 B 得到一个相似的集合。然后,我们在两个集合之间执行交叉连接,得到:

{a1} {a2 a3} | {b1} {b2 b3}

{a2} {a1 a3} | {b2} {b1 b3}
...

这与您上面的描述非常吻合。只需将 {Bob, Adam} 视为一组,将 {1, 2, 3} 视为另一组。根据您的要求,您必须转储一些空集(因为电源集也包括空子集)。不过,据我所知,这是一般要点。抱歉缺少代码;我要睡觉了:P

于 2012-06-04T22:28:56.560 回答
0

忽略您的其他约束(例如团队的最大规模),您正在做的是创建集合P的分区和具有相同子集数量的集合Q的分区,然后找到其中一个集合的所有组合以映射第一个分区到第二个。

Michael Orlov 的论文似乎是一种用于生成分区的简单算法,在该算法中,每次迭代都使用恒定空间。他还提供了一种用于列出给定大小的分区的算法。

P = { A, B }Q = { 1, 2, 3 }开始,那么大小为 1 的分区是[ P ][ Q ],所以唯一的配对是( [ P ], [ Q ] )

对于大小为 2 的分区,P只有两个元素,因此只有一个大小为 2 的分区[ { A }, { B } ]Q有三个大小为 2 的分区[ { 1 }, { 2, 3 } ], [ { 1 , 2 }, { 3 } ], [ { 1, 3 }, { 2 } ]

由于Q的每个分区包含两个子集,因此每个分区有 2 种组合,这为您提供了六个配对:

( [ { A }, { B } ], [ { 1 }, { 2, 3 } ] )
( [ { A }, { B } ], [ { 2, 3 }, { 1 } ] )
( [ { A }, { B } ], [ { 1, 2 }, { 3 } ] )
( [ { A }, { B } ], [ { 3 }, { 1, 2 } ] )
( [ { A }, { B } ], [ { 1, 3 }, { 2 } ] ) 
( [ { A }, { B } ], [ { 2 }, { 1, 3 } ] ) 

由于其中一个原始集合的大小为 2,因此没有大小为 3 的分区,因此我们停止。

于 2012-06-06T10:14:04.590 回答