当我在 R 中提取数据框列的因子水平时,它们会自动排序(按字母顺序)。我怎样才能防止这种情况?也就是说,我希望级别的顺序与数据框列中的顺序相同。
data.frame(Names = c("Paul McCartney", "John Lennon")) -> my.data
levels(my.data$Names)
[1] “约翰列侬” “保罗麦卡特尼”
读取数据后重新分配因子:
x <- data.frame(x=letters[c(2,1,2)], y=1:3)
x$x
## [1] b a b
## Levels: a b
x$x <- factor(x$x, levels=unique(x$x))
x$x
## [1] b a b
## Levels: b a
如果您想阻止因子的排序,您需要专门将因子水平移交为levels
:
factor(c("Paul McCartney", "John Lennon"), levels = c("Paul McCartney", "John Lennon"))
## [1] Paul McCartney John Lennon
## Levels: Paul McCartney John Lennon
在您的情况下,您应该在创建factor
之前创建data.frame
并将其粘贴factor
到data.frame
:
f1 <- factor(c("Paul McCartney", "John Lennon"), levels = c("Paul McCartney", "John Lennon"))
my.data <- data.frame(Names = f1)
levels(my.data$Names)
## [1] "Paul McCartney" "John Lennon"