0

我有兴趣将Record-LinkagelevenshteinSim包中的函数应用于字符串向量(这里对函数进行了很好的讨论)。

想象一下,我有一个名为codes:"A","B","C","D"等的向量;还有一个叫做tests:"A","B","C","D"等的向量。

sapply用于针对 的向量测试“测试”中的特定值codes

sapply(codes,levenshteinSim,str2=tests[1])

我希望得到一个列表或向量(如果我犯了术语错误,我深表歉意)[score1] [score2] [score3]:.

不幸的是,输出是tests[1]针对c("A","B","C","D", ...)单个值的值的测试。

最终,我希望*apply这两个向量相互对抗以产生一个长度矩阵len1*len2——但我不想继续前进,直到我明白我做错了什么。

任何人都可以提供指导吗?

4

1 回答 1

0

我不确定问题出在哪里:

 library(RecordLinkage)
 sapply(codes,levenshteinSim,str2=test)
     A B C D
[1,] 1 0 0 0
[2,] 0 1 0 0
[3,] 0 0 1 0
[4,] 0 0 0 1

当 str2 只是一项时,您会得到一个长度为 4 的向量。

于 2013-11-05T23:54:42.283 回答