0

levenshteinSim()用来做近似的字符串匹配。我在这里面临一个问题是我的数据是什么样的

string = "Mitchell" 
stringvector = c("Ray Mitchell", "Mitchell Dough","Juila Mitch")

. 我希望算法只匹配字符串向量的第二部分,而不是前半部分。我该怎么做。我真的很感谢你的帮助。以及如何使用称重模式?谢谢科塔瓦里

4

1 回答 1

0

我相信您需要预处理数据以提取字符串的第二部分并使用算法。

其他人似乎先做一些预处理。看这里

于 2013-07-31T15:46:11.330 回答