r - 在 R 中渲染缅甸字符

翻译自：https://stackoverflow.com/questions/17934847 2013-07-29T21:48:31.983

135 次

我正在处理缅甸语文本，并尝试在 R 中运行主题模型。R 似乎无法显示和呈现缅甸语字符。当我将数据设置为 data.frame 时，缅甸字符会正确呈现：

data<-read.csv("data.csv", fileEncoding ="UTF8", encoding="UTF-8", stringsAsFactors=FALSE) 
filenames<-data[,2]
txts<-data[,5] 
docs <-data.frame(docs= txts,row.names=filenames)
ds <- DataframeSource(docs)
cases<-Corpus(ds)
cases[[1]]

လိုက်... #[the rest is a text file with properly rendered Burmese]

但是，当文本不是来自 data.frame 或直接来自 csv 文件时，有几个字符：

data[1,5]

လိုက\u103a

其余的是一段文本，其中一些重音符号显示不正确，如本例所示。

我已经检查了使用的编码Encoding()，R 确认在这两种情况下我都使用 UTF-8。

仅供参考，我使用的是运行 R64 的 Mac。我有一位使用 PC 的同事并没有遇到此问题，但我们无法隔离问题。

r - 在 R 中渲染缅甸字符

0 回答 0

Related

Reference