1

我正在使用 R 中的 qdap 包进行拼写检查。我运行下面的代码并给出这样的输出

which_misspelled("I use a 50Gb broadband connection") 

> 4           5 
>"gb" "broadband"

这些词是有道理的,但对这些词的更正是无关紧要的。是否有任何选项可以让我们为此功能提供自定义词列表以不过滤?

4

1 回答 1

3

该函数which_misspelled()包含dictionary =默认为qdapDictionaries::GradyAugmented的参数。如果您输入的单词没有出现在那里,它将被视为拼写错误

例如,如果您希望将单词"gb"识别为正确的拼写,则应定义一个新的dictionary

library(qdap)
dict <- c(qdapDictionaries::GradyAugmented, "gb")
which_misspelled("I use a 50Gb broadband connection", dictionary = dict)
#          5 
#"broadband" 
于 2016-11-28T16:28:49.683 回答