agrep 函数给出了一些令人费解的结果,我想更好地理解它的行为。例如:
agrep("abcd",c("abc","abcde","abcef"),value=T,max.distance = 1)
回报:
[1] "abc" "abcde" "abcef"
但是“abcd”和“abcef”之间的距离是2。所以我不确定为什么会出现第三场比赛。
levenshteinDist("abcd","abcef") # gives the answer of 2
另外,我假设如果距离上限设置为 0,该函数将仅返回完全匹配:
agrep("abcd",c("abc","abcde","abcef"),value=T,max.distance = 0)
但是,我得到[1] "abcde"
了比赛
如果有人可以解释 agrep 中的匹配是如何工作的,那将非常有帮助。