2

我在 Win 7 x64 上使用 R 版本 2.15.2 (2012-10-26) 和 RStudio 版本 0.97.168,语言环境为 English_United Kingdom.1252。

我想使用 'gsub' 将 'christian grgić' 替换为 'christian grgi[ćc]' (后面的字符串稍后将用作正则表达式来查找重音和非重音版本的名称)。

然而,R 似乎没有将 ć 识别为带重音的 c。这段代码

name <- "christian grgić"
gsub("ć","[cć]",name)

给出这个输出

[1] "[cc]hristian grgi[cc]"

而不是我想要的:

[1] "christian grgi[cć]"

任何帮助深表感谢。

4

1 回答 1

3

尝试这个:

Encoding(name) <- "UTF-8"
gsub("ć","[cć]",name)
#[1] "christian grgi[cć]"

请注意,这是我从 sessionInfo() 获得的本地信息:

> locale: [1]
> en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
于 2012-11-24T01:50:06.077 回答