4

我想知道是否有一种方法可以根据向量中的位置提取一个值,例如,我有一个包含两个向量的数据框,我将它们按 V1 从原始分组,按 V2 分组,就像 ORDER SQL 中的 BY。当我尝试退出每个 V1 组类型的第 3 分钟时,我的问题就出现了。

有序数据框...

V1  V2
Ford    18
Ford    16
Ford    15
Ford    14
Ford    12
**Ford  5**
Ford    2
Ford    1
Nisan   10
Nisan   9
Nisan   8
Nisan   7
Nisan   6
**Nisan     5**
Nisan   4
Nisan   3
Toyota  20
Toyota  19
Toyota  15
Toyota  12
Toyota  11
**Toyota    10**
Toyota  6
Toyota  2

结果我想要在新数据框中,每个变量的第三个最小值......

V1 V2
Ford 5
Nisan 5
Toyota 10

提前致谢。

4

2 回答 2

6

尝试

library(data.table)#v1.9.5+
setDT(df1)[order(V2), list(V2=V2[3L]), by = V1]

或者正如评论中提到的@DavidArenburg

setDT(df1)[, .SD[frank(V2, ties.method = "dense") == 3L], by = V1]

或者

library(dplyr)
 df1 %>% 
     group_by(V1) %>%
     filter(rank(V2)==3)

或者

 df1 %>%
     group_by(V1) %>% 
     arrange(V2) %>%
     slice(3L)
于 2015-05-04T15:46:30.677 回答
6

使用 base R 你可以做类似的事情

aggregate(V2 ~ V1, df[order(df$V2), ], `[`, 3L)
#       V1 V2
# 1   Ford  5
# 2  Nisan  5
# 3 Toyota 10

或者(根据@akruns 评论)使用ave

df[with(df, ave(V2, V1, FUN = order)) == 3L,]
于 2015-05-04T15:50:55.467 回答