我希望读取我从 GCS 以 Unicode 格式下载的 R 中的 CSV 文件。
当我尝试读取文件时,它是这样的:
警告消息:在扫描中(文件 = 文件,什么 = 什么,sep = sep,报价 = 报价,dec = dec,:在输入连接“reviews_report_201605.csv”上找到无效输入
数据被读取到第 39 行,它遇到一个特殊字符并且无法进一步读取:
未登录部分的 2 个基本功能不起作用。,2016-05-03T09:52:06Z,1462269126290
当代码到达那个笑脸时,代码会被截断。我也不介意把笑脸看成问号。
我的解决方法是通过记事本将 CSV 保存为 ANSI 文件,该文件将相同的笑脸转换为 ??。
我如何在 R 中做到这一点?我尝试了多种方法,但都没有奏效,而且由于文件很多,因此无法手动操作。
我在文件中应用的代码是 Unicode 如下:
reviews1 <- read.csv("reviews_report_201605.csv", header = T,stringsAsFactors = F,fileEncoding = "UTF-16LE")
请就如何解决此问题提出任何建议。