我正在尝试使用 stringdist 包以进行模糊连接,但遇到了一个我不理解且无法找到答案的问题。我想用“dl”方法加入这两个数据表,它会产生一个 NA,我完全不明白。也许你们中的一个人对此有一个解释。编码:
library(fuzzyjoin)
test1<-as.data.frame(test1<-c("techniker"))
test2<-as.data.frame(test2<-c("technician"))
setnames(test2,1,"label")
setnames(test1,1,"label")
x <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl")
但是,如果我使用 jaccard 方法,则会有一个匹配项:
y <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="jaccard", q=4)
希望任何人都可以澄清。
干杯穹顶