1

我正在阅读.csv 一个包含一些自然出现的文本的文件。有时在文本中,' 用作撇号,有时使用 ' 代替(参见本表的第 2 行和第 6 行)。

在我的笔记本电脑上读取 RStudio 中的文件时,我没有问题(文本中都有 ' 和 ' )。但是,在 Rstudio 服务器(EC2 实例)中读取文件时,所有的 ' 都被 \x92 替换,这是一个问题。

在这个问题的第一个答案的第一个要点之后,我尝试通过 RStudio 服务器中的全局选项菜单来更改编码:Unicode、UTF-8、UTF-16、Windows-1252、ISO8859-1 等。

不幸的是,无论我的选择如何,每次都会出现同样的问题。

非常感谢您的帮助。

4

1 回答 1

1

我刚刚找到了一个解决方案,所以我正在回答我自己的问题:

不知何故,我尝试通过 RStudio 服务器中的全局选项菜单设置编码对 read.csv 没有任何影响(我认为它应该默认使用全局选项中指定的编码getOption("encoding"),但它似乎并非总是如此......)

无论如何,通过使用 fileEncoding 参数直接在 read.csv 中指定编码类型,并通过检查数据,我可以看到这次我的不同编码选择产生了影响。经过几次试验,我发现“Windows-1252”给了我想要的东西。

于 2015-03-15T17:56:12.533 回答