我总是将 excel 文件转换为 CSV 文件以导入到 R,如下所示。
myDataFrame <- read.csv("mydatafile.csv", stringsAsFactors=F)
但是,当我转换用中文编写的 xlsx 文件时,我遇到了一个严重的问题。大多数字符(不是全部)显示'??' 因为编码。
所以,我决定使用xlsx
包直接导入。但问题是excel文件的大小超过10MB。由于 JVM 内存限制,它给了我一条错误消息。(我假设在xlsx
内部使用 Java。)
.jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, 中的错误:
java.lang.OutOfMemoryError: 超过 GC 开销限制
如何将中文excel文件导入R?我尝试了“另存为..”CSV 文件,并在记事本中打开它,并使用选项“UTF-8”保存它。但结果是一样的(显示'??')。
仅供参考,我可以在原始 excel 文件中看到完整的汉字。