6

我正在为这样的匹配程序使用两个字符串:

string s1= 5-4-6-+1-+1+1+3000+12+21-+1-+1-+1-+2-3-4-5-+1-+10+1-+1-+;
string s2= 6-+1-+1+1+3000+12+21-+1-+1-+1-+1-+1-+1+1-+1-+;

我将编写一个正则表达式匹配函数,它分别比较每个“+”之间的每个部分字符串并计算匹配百分比,即每个字符串中出现的匹配数。例如在这个例子中,我们有这些匹配:

6

1

1

1

3000

12

21

1

1

1

--

1

--

1

1

在此示例中,匹配百分比为 13*100/15=87%。

目前我正在使用下面的函数,但我认为它没有优化,使用 Regex 可能会更快。

public double MatchPercent(string s1, string s2) {
    int percent=0;
    User = s1.Split('+').ToArray();
    Policy = s2.Split('+').ToArray();

    for (int i = 0; i < s1.Length - 2; i++) {
        int[] U = User[i].Split('-').Where(a => a != "").Select(n => 
                      Convert.ToInt32(n)).Distinct().ToArray();
        int[] P = Policy[i].Split('-').Where(a => a != "").Select(n => 
                      Convert.ToInt32(n)).Distinct().ToArray();
        var Co = U.Intersect(P);
        if (Co.Count() > 0) {
            percent += 1;
        }
    }
    return Math.Round((percent) * 100 / s1.Length );
}
4

1 回答 1

2

更好的解决方案是 Levenshtein Word Distance 算法。一些 C# 示例:

从匹配的字符中,您还可以计算百分比。

于 2013-06-12T08:06:38.007 回答