1

我有两个这样的字符串:

String1: EnableAdvertResult 
String2:AdvertisementDel

然后我像这样拆分它们:

 X[0]=Enable X[1]=Advert X[2]=Result

 Y[0]=Advertisement Y[1]=Del

然后计算每对元素之间的相似度,如下所示:

sim(x[0],y[0])=a, 
sim(x[0],y[1])=b, 
sim(x[1],y[0])=c, 
sim(x[1],y[1])=d, 
sim(x[2],y[0])=e, 
sim(x[2],y[1])=f

现在我想知道,根据上面的 sim 计算 string1 和 string2 之间相似度的最佳方法是什么?

4

2 回答 2

0

它被称为 Levenshtein 距离。可以在 Levenshtein distance c# 找到 C# 代码。我相信你也可以找到java代码。

于 2013-03-07T15:47:55.307 回答
0

您想要字符串之间的 Levenshtein 距离,这是在Apache StringUtils中实现的。我使用了 Apache 版本的 Levenshtein,效果很好。另请参阅有关字符串比较的Stackoverflow 文章。

于 2013-03-07T15:51:08.853 回答