1

请看图表和数据。在绘图“px4”和其他绘图之间找到最接近匹配(最高相似度)的方法或算法是什么。如果有任何 C# 库或 VF-Graph 识别算法可以适应这个问题,任何建议都将不胜感激。

来自数据的 px PLOTS

数据

    enr px1 px2 px3 px4 px5 px6
    1   90  5   15  20  60  10
    2   70  10  20  30  85  15
    3   100 15  15  10  32  18
    4   80  20  8   3   9   44
    5   60  25  3   5   15  12
    6   50  30  12  8   24  16
    7   70  18  28  24  70  25
    8   90  12  32  28  84  22
    9   75  20  12  15  45  16
    10  65  10  20  18  54  25
4

2 回答 2

3

我不是统计专家。但是...我会绘制一个图并比较每个点与另一个图上的等效点之间的差异,一次一个点。我会使用 Math.Abs​​() 将这 10 个差异中的每一个都转换为正数,然后使用您希望的任何方法(平均值、中位数等)来取 10 个差异的平均值。我会重复每个其他情节的比较。大多数计算可以沿途放弃,您只需要保留每个图的平均数。最小的平均值可能是最接近匹配的图。

因为我今天没有太多事情要做...

Dictionary<string, int[]> plots = new Dictionary<string, int[]>();

plots.Add("px1", new int[] { 90, 70, 100, 80, 60, 50, 70, 90, 75, 65 });
plots.Add("px2", new int[] { 5, 10, 15, 20, 25, 30, 18, 12, 20, 10 });
plots.Add("px3", new int[] { 15, 20, 15, 8, 3, 12, 28, 32, 12, 20 });
plots.Add("px4", new int[] { 20, 30, 10, 3, 5, 8, 24, 28, 15, 18 });
plots.Add("px5", new int[] { 60, 85, 32, 9, 15, 24, 70, 84, 45, 54 });
plots.Add("px6", new int[] { 10, 15, 18, 44, 12, 16, 25, 22, 16, 25 });

string test = "px4";
string winner = string.Empty;
double smallestAverage = double.MaxValue;

foreach (string key in plots.Keys)
{
    if (key == test)
    {
        continue;
    }

    int[] a = plots[test];
    int[] b = plots[key];

    double count = 0;

    for (int point = 0; point <= 9; point++)
    {
        count += Math.Abs(a[point] - b[point]);
    }

    double average = count / 10;

    if (average < smallestAverage)
    {
        smallestAverage = average;
        winner = key;
    }
}

Console.WriteLine("Winner: {0}", winner);
于 2012-04-04T08:03:06.183 回答
2

从字面上看,有无数种方法可以定义两个图表之间的“差异”。

如果您将图形视为 10 维向量,则可以使用向量 norm

如果要将它们视为区间 [1, 10] 上的实值函数,则可以在L^p-space上使用范数。(虽然这应该涉及积分,因为你的函数都是由直线段组成的,你可以精确地计算这个范数,而不必对积分进行数值逼近。)

确实,您需要决定如何定义“相似”,然后选择一种符合您预期的方法。

于 2012-04-04T09:04:59.020 回答