7

我正在努力让 R 读取一个 csv 文件,该文件的一些列是标准英文字符,一些数字和一些字段是日文字符。数据如下所示:

category,desc,otherdesc,volume
UPC - 31401 Age Itameabura,かどや製油 純白ごま油,OIL_OTHERS_SML_ECO,83.0
UPC - 31401 Age Itameabura,オレインリッチ,OIL_OTHERS_MED,137.0
UPC - 31401 Age Itameabura,TVキャノーラ油,OIL_CANOLA_OTHERS_LRG,3026.0 

保持 R 的语言设置为英语,日文字符被转换成一些乱码。当我将 R 中的语言设置更改为日语时Sys.setlocale("LC_CTYPE", "japanese"),我看到文件根本没有读入。R给出一个错误说:

make.names(col.names, unique = TRUE) 中的错误:'サcategory' 处的多字节字符串无效

我不知道我的 csv 文件或标题名称有什么问题。您能否指导我如何将这个 csv 文件读入 R 中,以便所有内容都像在 csv 文件中一样显示?

谢谢!维什

4

1 回答 1

2

对于日语,以下对我有用:

df <- read.csv("your_file.csv", fileEncoding="cp932")

于 2016-05-11T04:07:03.967 回答