3

当我在 R 中提取数据框列的因子水平时,它们会自动排序(按字母顺序)。我怎样才能防止这种情况?也就是说,我希望级别的顺序与数据框列中的顺序相同。

data.frame(Names = c("Paul McCartney", "John Lennon")) -> my.data
levels(my.data$Names)

[1] “约翰列侬” “保罗麦卡特尼”

4

2 回答 2

9

读取数据后重新分配因子:

x <- data.frame(x=letters[c(2,1,2)], y=1:3)
x$x
## [1] b a b
## Levels: a b
x$x <- factor(x$x, levels=unique(x$x))
x$x
## [1] b a b
## Levels: b a
于 2013-06-03T12:57:54.340 回答
2

如果您想阻止因子的排序,您需要专门将因子水平移交为levels

factor(c("Paul McCartney", "John Lennon"), levels = c("Paul McCartney", "John Lennon"))
## [1] Paul McCartney John Lennon   
## Levels: Paul McCartney John Lennon

在您的情况下,您应该在创建factor之前创建data.frame并将其粘贴factordata.frame

f1 <- factor(c("Paul McCartney", "John Lennon"), levels = c("Paul McCartney", "John Lennon"))
my.data <- data.frame(Names = f1)
levels(my.data$Names)

## [1] "Paul McCartney" "John Lennon" 
于 2013-06-03T12:49:58.950 回答