9

我正在整理一些看起来几乎相同的表格,除了一些字符在某些字符中出现重音而在其他字符中出现非重音。例如,“André”有时会读作“Andre”、“Flávio”和“Flavio”等。我需要将所有变体视为相同,但 unique() 将它们视为不同。我想过将所有重音改为非重音,然后使用 unique(),但我认为也许还有另一个更快的选择。

稍后我需要使用 == 进行相同的不区分重音的比较,因此我正在考虑从每个表的副本中删除所有重音,并对副本进行比较。请告诉我是否有其他更好的方法。

4

1 回答 1

6

在比较之前删除重音的方法似乎适合您的目的。请注意,此类设施iconvTRANSLIT标志一起存在

iconv(c("André","Flávio"),to='ASCII//TRANSLIT')
#> [1] "Andre"  "Flavio"
于 2015-08-12T19:11:32.897 回答