r - 从数据框中提取列并对其进行排序

Question

我有一个看起来像这样的数据框：

structure(list(Mash_pear = c(0.192474082559755, 0.679726904159742, 
0.778564545349054, 0.573745352397321, 0.56633658385284, 0.472559997318901, 
0.462635414367878, 0.562128414492567, 0.354624921832056, 0.64532681437697
), tRap_pear = c(0.0350096175177328, 0.234255507711743, 0.23714999195134, 
0.185536020521134, 0.191585098617356, 0.201402054387186, 0.220911538536031, 
0.216072802572045, 0.132247101763063, 0.172753098431029), Beeml_pear = c(0.179209909971615, 
0.79129167285928, 0.856908302056589, 0.729078080521886, 0.709346164378725, 
0.669599784720647, 0.585348196746785, 0.639355942917055, 0.544909349368496, 
0.794652394149651), Mash_pear2080 = c(0.823944540480775, 0.816630852343513, 
0.81134728399675, 0.801065036203532, 0.799630945085954, 0.799195606444727, 
0.798637867344115, 0.798478922129054, 0.798090734787886, 0.797673368802285
)), .Names = c("Mash_pear", "tRap_pear", "Beeml_pear", "Mash_pear2080"
), row.names = c("Aft1", "Alx3_3418.2", "Alx4_1744.1", "Arid3a_3875.1_v1_primary", 
"Arid3a_3875.1_v2_primary", "Arid3a_3875.2_v1_primary", "Arid3a_3875.2_v2_primary", 
"Arid5a_3770.2_v1_primary", "Arid5a_3770.2_v2_primary", "Aro80"
), class = "data.frame")

现在我有了对这些分数进行排名的想法，但是每一列都应该单独排名，并保持行名不变。因此，我尝试逐个提取所有列并对其进行排序。尝试订购 1 列时出现我遇到的问题。即我的数据框消失并成为数值向量，正如我已经指出的那样，我需要数据框（行名）保持原样，仅排序。我现在正在处理的代码在这里：

rowname<-rownames(pearframe)
col1<-subset(pearframe, select=1)[order(pearframe),]
col2<-subset(pearframe, select=2)[order(pearframe),]
col3<-subset(pearframe, select=3)[order(pearframe),]
col4<-subset(pearframe, select=4)[order(pearframe),]

这将删除我的行名和原始数据框结构。这使得我无法对我的数据进行排名。所以实际的问题是：我如何对每列的数据帧进行排序/排序并创建 4 个新帧，每个帧有 1 个有序列。最终我想要一个表格，其中包含每个排名框架的行名和分数。

score 4 · Accepted Answer

你需要使用drop=FALSE两次，我认为：

subset(pearframe, select=1,drop=FALSE)[order(pearframe[,1]),,drop=FALSE]

其他情况看起来相同，在出现的两个地方都增加 1。

编辑：另外，这更简洁：

pearframe[order(pearframe[,1]),1,drop=FALSE]

EDIT2：这就是使用这种方法制作最终 data.frame 的方法：

col_list <- list()
for (i in 1:4){
    col_list[[i]] <- pearframe[order(pearframe[,i]),i,drop=FALSE]
    col_rnname <- paste(names(pearframe)[[i]],"rn",sep=".")
    col_list[[i]][[col_rnname]] <- rownames(col_list[[i]])
    rownames(col_list[[i]]) <- NULL
}
col_mat <- do.call(cbind,col_list)

score 4 · Accepted Answer

另一种方法是利用 adata.frame只是一堆列表的事实。您可以使用lapply，这将为您提供data.frames. 您可以通过列名访问每一个，如果您愿意，可以将其分配给一个新的 df：

ranks <- lapply( df , function(x) data.frame( rank = rownames(df)[ order( x ) ] , score = x[ order(x) ] ) )
names(ranks) <- names(df)

head(ranks[["Mash_pear"]])
#                     rank     score
#1                     Aft1 0.1924741
#2 Arid5a_3770.2_v2_primary 0.3546249
#3 Arid3a_3875.2_v2_primary 0.4626354
#4 Arid3a_3875.2_v1_primary 0.4725600
#5 Arid5a_3770.2_v1_primary 0.5621284
#6 Arid3a_3875.1_v2_primary 0.5663366

head(ranks[["tRap_pear"]])
#                     rank      score
#1                     Aft1 0.03500962
#2 Arid5a_3770.2_v2_primary 0.13224710
#3                    Aro80 0.17275310
#4 Arid3a_3875.1_v1_primary 0.18553602
#5 Arid3a_3875.1_v2_primary 0.19158510
#6 Arid3a_3875.2_v1_primary 0.20140205

r - 从数据框中提取列并对其进行排序

2 回答 2

Related

Reference