4

我正在寻找一种快速算法来确定给定二维数组的特定最小属性 - 没有共同行或列的最小值的总和。我确定这必须有一个名字,但我不知道它叫什么。

我有一个字符串匹配系统,它将在空格上拆分输入字符串并将其与搜索值的语料库(也拆分为空格)进行比较,并返回每个字符串中标记之间的距离矩阵,我想减少通过采用不重复使用任何输入/输出令牌组合的最小距离组合,将其变为单个聚合距离。

例子:

{ 1, 2 }   => 5 (either 1+4, or 3+2)
{ 3, 4 }

{ 0, 2 }   => 6 (because 2+4 < 0+8)
{ 4, 8 } 

{ 1, 0, 0 }
{ 0, 1, 0 } => 0
{ 0, 0, 1 }

{ 2, 3, 4 }
{ 3, 2, 4 } => 6 (2+2+2)
{ 4, 3, 2 } 

到目前为止,我一直在使用的朴素算法看起来像这样(C#):

public static int Minimux(this int[,] array) {
  var xUsed = new bool[array.GetLength(0)];
  var yUsed = new bool[array.GetLength(1)];
  var xMax = array.GetLength(0);
  var yMax = array.GetLength(1);
  var minima = new List<int>();
  var limit = Math.Min(xMax, yMax);
  int xMin = 0, yMin = 0;
  while (minima.Count < limit) {
    var vMin = Int32.MaxValue;
    for (var x = 0; x < xMax; x++) {
      for (var y = 0; y < yMax; y++) {
        if (xUsed[x] || yUsed[y] || array[x, y] >= vMin) continue;
        vMin = array[x, y];
        xMin = x;
        yMin = y;
      }
    }
    xUsed[xMin] = true;
    yUsed[yMin] = true;
    minima.Add(vMin);
  }
  return (minima.Sum());
}

它基本上进行数组扫描,并在找到每个最小值时,将行/列组合标记为“已使用”,因此不会再次考虑它 - 一旦列表中的最小值与最短的元素一样多数组维度,它返回这些最小值的总和。

问题是它在这样的情况下崩溃了:

{ 0, 0, 0 }
{ 0, 0, 0 } => 3 (when it should be returning 1)
{ 1, 2, 3 } 

当扫描到达最后一行时,它已经将第 0 列和第 1 列标记为“已使用”,因此第 2 行中的最小未使用值是3它应该实际使用1

是否存在用于执行此操作的标准算法?

4

1 回答 1

5

是的,有一个标准算法可以完全解决这个问题。它的名字是匈牙利算法

于 2013-03-12T14:48:05.380 回答