我正在通过 RJDBC 从 MySQL 数据库读取文件,它正确显示了 R 中的所有字母(例如,נווה שאנן)。然而,即使使用 write.csv 和 fileEncoding="UTF-8" 导出它,输出看起来像
<U+0436>.<U+043A>. <U+041B><U+043E><U+0437><U+0435><U+043D><U+0435><U+0446>
保加利亚语、希伯来语、中文等(在这种情况下,这不是上面的字符串,而是保加利亚语的字符串)。ã,ç 等其他特殊字符也可以正常工作。
我怀疑这是因为 UTF-8 BOM 但我没有在网上找到解决方案
我的操作系统是德语 Windows7。
编辑:我试过
con<-file("file.csv",encoding="UTF-8")
write.csv(x,con,row.names=FALSE)
和(afaik)等价物write.csv(x, file="file.csv",fileEncoding="UTF-8",row.names=FALSE)
。