-1

我正在尝试清理一个数据库,其中的因素已经用不同的词进行了估算,但含义相同。

例如:从“Purring cat with tail, 4 leg and fur”“European tabby cat”“Cat CAT cat”“Cat”

我研究gsub了命令和stringr命令的类型,但无法实现我的目标。

有什么建议吗?

编辑:抱歉不清楚,这是我的第一篇文章。

我想用一个替换几个词。如果“猫”出现在条目中的任何位置,我希望将整个条目重命名为“猫”。到目前为止,我只能用其他东西替换条目的某些部分,但不能删除多余的单词。

4

1 回答 1

2

试试这个

x <- c("Purring cat with tail, 4 legs and fur", "European tabby cat", 
"dog", "Cat CAT cat", "bird")

replace(x, grepl("(?i)cat", x, perl=TRUE), "Cat")
# [1] "Cat"  "Cat"  "dog"  "Cat"  "bird"
于 2015-01-18T22:56:37.647 回答