我正在寻找一种快速算法来确定给定二维数组的特定最小属性 - 没有共同行或列的最小值的总和。我确定这必须有一个名字,但我不知道它叫什么。
我有一个字符串匹配系统,它将在空格上拆分输入字符串并将其与搜索值的语料库(也拆分为空格)进行比较,并返回每个字符串中标记之间的距离矩阵,我想减少通过采用不重复使用任何输入/输出令牌组合的最小距离组合,将其变为单个聚合距离。
例子:
{ 1, 2 } => 5 (either 1+4, or 3+2)
{ 3, 4 }
{ 0, 2 } => 6 (because 2+4 < 0+8)
{ 4, 8 }
{ 1, 0, 0 }
{ 0, 1, 0 } => 0
{ 0, 0, 1 }
{ 2, 3, 4 }
{ 3, 2, 4 } => 6 (2+2+2)
{ 4, 3, 2 }
到目前为止,我一直在使用的朴素算法看起来像这样(C#):
public static int Minimux(this int[,] array) {
var xUsed = new bool[array.GetLength(0)];
var yUsed = new bool[array.GetLength(1)];
var xMax = array.GetLength(0);
var yMax = array.GetLength(1);
var minima = new List<int>();
var limit = Math.Min(xMax, yMax);
int xMin = 0, yMin = 0;
while (minima.Count < limit) {
var vMin = Int32.MaxValue;
for (var x = 0; x < xMax; x++) {
for (var y = 0; y < yMax; y++) {
if (xUsed[x] || yUsed[y] || array[x, y] >= vMin) continue;
vMin = array[x, y];
xMin = x;
yMin = y;
}
}
xUsed[xMin] = true;
yUsed[yMin] = true;
minima.Add(vMin);
}
return (minima.Sum());
}
它基本上进行数组扫描,并在找到每个最小值时,将行/列组合标记为“已使用”,因此不会再次考虑它 - 一旦列表中的最小值与最短的元素一样多数组维度,它返回这些最小值的总和。
问题是它在这样的情况下崩溃了:
{ 0, 0, 0 }
{ 0, 0, 0 } => 3 (when it should be returning 1)
{ 1, 2, 3 }
当扫描到达最后一行时,它已经将第 0 列和第 1 列标记为“已使用”,因此第 2 行中的最小未使用值是3
它应该实际使用1
是否存在用于执行此操作的标准算法?