r - dplyr 过滤器使用 qdap::which_misspelt 或 dplyr 过滤器与嵌套函数

Question

一个小数据框：

words <- data.frame(terms = c("qhick brown fox",
          "tom dick harry", 
          "cats dgs"))

如果我使用qdap::which_misspelled，我可以找出拼写错误的单词：

> which_misspelled(words)
      1       8 
"qhick"   "dgs"

但我想做的是在包含拼写错误的行上对单词 df 进行子集化。以上返回索引 1 和 8 引用我的 df 中提供的所有单词，无论哪一行。

如何根据包含拼写错误的任何行对我的 df 进行子集化？

（如果可以使用 dplyr 过滤器完成，则奖励）

score 4 · Accepted Answer

如何只使用check_spelling哪个是矢量化的，结果包含一列行号，您可以使用它来对数据框进行子集化：

library(qdap)
words[check_spelling(words$terms)$row,,drop=F]

#            terms
#1 qhick brown fox
#3        cats dgs

该which_misspelled函数似乎旨在检查单个字符串而不是数据框：

which_misspelled - 检查字符串的拼写。

1 回答 1