我有一张拼错单词的桌子。我需要更正那些使用与那个词更相似的词,即频率更高的词。
例如,在我运行之后
aggregate(CustomerID ~ Province, ventas2, length)
我明白了
1
2 AMBA 29
3 BAIRES 1
4 BENOS AIRES 1
12 BUENAS AIRES 1
17 BUENOS AIRES 4
18 buenos aires 7
19 Buenos Aires 3
20 BUENOS AIRES 11337
35 CORDOBA 2297
36 cordoba 1
38 CORDOBESA 1
39 CORRIENTES 424
所以我需要用 BUENOS AIRES 替换 buenos aires, Buenos Aires, Baires, BUENOS AIRES,但不应该替换 AMBA。CORDOBESA 和 cordoba 也应替换为 CORDOBA,而不是 CORRIENTES。
我怎样才能在 R 中做到这一点?
谢谢!