0

我对 R 很陌生,这可能有一个简单的答案,但仍然:我在表单上有一个数据框

df <- data.frame(c("a", "b", "c", "d", "e"), 1:5, 7:11, stringsAsFactors=FALSE)
names(df) <- c("en", "to", "tre")

我的数据集比这大得多,行和列更多。但基本思想是相同的:我想对 n 个最高数值进行排序,与它们出现在哪一列无关,并返回一个列表,其中的值按降序排列,它们在“en”列中对应的字符串。

像这样:

e  11
d  10
c   9
b   8
a   7
e   5

等等。

我怎么能做到这一点?

4

2 回答 2

3

您可以使用该包reshape2来融合您的数据并对值列进行排序,如下所示:

require(reshape2)
df <- data.frame(c("a", "b", "c", "d", "e"), 1:5, 7:11, stringsAsFactors=FALSE)
names(df) <- c("en", "to", "tre")

df2 <- melt(df, id = "en")
## 'data.frame':    10 obs. of  3 variables:
##  $ en      : chr  "a" "b" "c" "d" ...
##  $ variable: Factor w/ 2 levels "to","tre": 1 1 1 1 1 2 2 2 2 2
##  $ value   : int  1 2 3 4 5 7 8 9 10 11

df2[order(df2$value, decreasing = TRUE), c("en", "value")]
##    en value
## 10  e    11
## 9   d    10
## 8   c     9
## 7   b     8
## 6   a     7
## 5   e     5
## 4   d     4
## 3   c     3
## 2   b     2
## 1   a     1

但我敢肯定还有其他方法可以做到这一点!

于 2013-05-24T21:28:50.883 回答
0

不太优雅但没有额外的包(它适用于任意数量的列):

col1<-rep(df[,1],ncol(df)-1)
col2<-c()
for(i in 2:ncol(df)) {
    col2<-c(col2,df[,i])
}
newdf<-data.frame(en=col1,value=col2)
newdf<-newdf[order(as.numeric(newdf[,2]),decreasing=TRUE),]
于 2013-05-24T23:57:13.527 回答