r - 使用 unique() 和 == 来匹配重音字符和非重音字符

Question

我正在整理一些看起来几乎相同的表格，除了一些字符在某些字符中出现重音而在其他字符中出现非重音。例如，“André”有时会读作“Andre”、“Flávio”和“Flavio”等。我需要将所有变体视为相同，但 unique() 将它们视为不同。我想过将所有重音改为非重音，然后使用 unique()，但我认为也许还有另一个更快的选择。

稍后我需要使用 == 进行相同的不区分重音的比较，因此我正在考虑从每个表的副本中删除所有重音，并对副本进行比较。请告诉我是否有其他更好的方法。

score 6 · Accepted Answer

在比较之前删除重音的方法似乎适合您的目的。请注意，此类设施iconv与TRANSLIT标志一起存在

iconv(c("André","Flávio"),to='ASCII//TRANSLIT')
#> [1] "Andre"  "Flavio"

r - 使用 unique() 和 == 来匹配重音字符和非重音字符

1 回答 1

Related

Reference