0

我有一个数据框,其中包含需要使用 model.matrix 转换的列名和值中的西里尔文(俄语)字母。

model.matrix 将这些变量转换为 unicode 字符,例如 . 有没有办法将它们转换回来,或者首先避免转换?

library(tibble)
x <- tribble(~"тест", ~value1, ~value2,
         "тест", 5, 10,
         "тест2", 6, 11)
m <- model.matrix(value1 ~ ., data = x)

预期的结果是一个 model.matrix,其中包含应有的 UTF-8 字符。

4

1 回答 1

0

使用以下方法解决了问题stringi

library(stringi)
colnames(m) <- stri_unescape_unicode(gsub("<U\\+(....)>",
                                    "\\\\u\\1",
                                    colnames(m)))
于 2019-07-02T07:41:05.977 回答