我正在使用 R 中的 qdap 包进行拼写检查。我运行下面的代码并给出这样的输出
which_misspelled("I use a 50Gb broadband connection")
> 4 5
>"gb" "broadband"
这些词是有道理的,但对这些词的更正是无关紧要的。是否有任何选项可以让我们为此功能提供自定义词列表以不过滤?
我正在使用 R 中的 qdap 包进行拼写检查。我运行下面的代码并给出这样的输出
which_misspelled("I use a 50Gb broadband connection")
> 4 5
>"gb" "broadband"
这些词是有道理的,但对这些词的更正是无关紧要的。是否有任何选项可以让我们为此功能提供自定义词列表以不过滤?
该函数which_misspelled()
包含dictionary =
默认为qdapDictionaries::GradyAugmented的参数。如果您输入的单词没有出现在那里,它将被视为拼写错误。
例如,如果您希望将单词"gb"
识别为正确的拼写,则应定义一个新的dictionary
:
library(qdap)
dict <- c(qdapDictionaries::GradyAugmented, "gb")
which_misspelled("I use a 50Gb broadband connection", dictionary = dict)
# 5
#"broadband"